flink checkpoint 数据清理问题

赵旭晨 Fri, 21 May 2021 19:11:14 -0700

背景：1.flink 集群模式 standalone HA ，共三台，zk选举jobmanager，1 active  1 standby
2.文件系统由于公司原因，没有用hdfs，用的本地文件系统
3.backend用的增量rocksdb



配置情况：










进程分布情况如下:






问题：checkpoint数据在01（01是主jobmanager）上占用很小，但在02、03节点增长特别快，目前已占用数据盘90%的存储。
但由于使用的是增量rocksdb，不敢随意删chekpoint数据，想问问大佬们：
1.是否有办法让flink自动清理过期checkpoint，还是只能通过加磁盘方式解决？
2.我一直认为checkpoint数据是由主jobmanager触发写的，那么在当前情况应该只有01节点会写入checkpoint（本地磁盘），为什么02、03节点也会写入checkpoint，而且写入量比01大那么多？

flink checkpoint 数据清理问题

回复