Hi,
每次checkpoint都会生成文件的,在一个checkpoint期间内,可以配置文件大小合并等,
不同checkpoint的生成的文件无法合并,所以文件数量最少是和checkpoint时间间隔相关的,
如果checkpoint时间间隔比较短,就需要自己去合并小文件了

在 2022-06-06 16:44:51,"谭家良" <tanjl_w...@126.com> 写道:
>大家好,关于kafka数据消费到hive/filesystem(orc/parquet)我有个疑问。orc/parquet如何调整落地的文件大小?是根据checkpoint时间来的吗?在落地到hive/filesystem
> connector有什么优化建议吗?
>
>
>best,
>tanjialiang.
>
>
>| |
>谭家良
>|
>|
>tanjl_w...@126.com
>|

回复