Hi, 每次checkpoint都会生成文件的,在一个checkpoint期间内,可以配置文件大小合并等, 不同checkpoint的生成的文件无法合并,所以文件数量最少是和checkpoint时间间隔相关的, 如果checkpoint时间间隔比较短,就需要自己去合并小文件了
在 2022-06-06 16:44:51,"谭家良" <tanjl_w...@126.com> 写道: >大家好,关于kafka数据消费到hive/filesystem(orc/parquet)我有个疑问。orc/parquet如何调整落地的文件大小?是根据checkpoint时间来的吗?在落地到hive/filesystem > connector有什么优化建议吗? > > >best, >tanjialiang. > > >| | >谭家良 >| >| >tanjl_w...@126.com >|