回复： Flink sql 主动使数据延时一段时间有什么方案

Sun.Zhu Fri, 03 Jul 2020 09:23:21 -0700

感谢benchao和forideal的方案，
方法1.使用udf，查不到 sleep 等一下在查
--这个可以尝试
方法2.在 join operator处数据等一会再去查
—我们使用的是flink sql，不是streaming，所以该方案可能行不通
方法3.如果没有 join 上，就把数据发到source，循环join。
--我们这个维表join的场景类似filter的功能，如果关联上则主流数据就不处理了，所以不一定非要join上，只是想延迟一会提升准确率
方法4.如果你的source的mq支持延迟消息，这个应该就不需要Flink做什么了，直接用mq的延迟消息就可以了
—我们的source是kafka，好像不支持kafka的功能
方法5.扩展了下 Flink 的 Source。比如在 kafka connector 中加了一个 time.wait 
的属性，当用户设置了这个属性，就让source 的数据等一会儿发到下游。起到等一会的效果。
--这个方案需要修改源码，也可以试一下



Best
Sun.Zhu
| |
Sun.Zhu
|
|
[email protected]
|
签名由网易邮箱大师定制


在2020年07月3日 23:26，forideal<[email protected]> 写道：
Hi




刚刚本超说了四种方法，

方法1.使用udf，查不到 sleep 等一下在查

方法2.在 join operator处数据等一会再去查

方法3.如果没有 join 上，就把数据发到source，循环join。

方法4.如果你的source的mq支持延迟消息，这个应该就不需要Flink做什么了，直接用mq的延迟消息就可以了




上述方法应该都能实现相同的效果。




我们也实现了一种方法。这种方法是扩展了下 Flink 的 Source。比如在 kafka connector 中加了一个 time.wait 
的属性，当用户设置了这个属性，就让source 的数据等一会儿发到下游。起到等一会的效果。




Best forideal

















在 2020-07-03 23:05:06，"Benchao Li" <[email protected]> 写道：
奥，对，还有一种思路。如果你的source的mq支持延迟消息，这个应该就不需要Flink做什么了，直接用mq的延迟消息就可以了。

admin <[email protected]> 于2020年7月3日周五 下午5:54写道：

Hi，all
我们有这样一个场景，双流join，一个快流，一个慢流，想让快流等一段时间，目的是能提高join的命中率。
FLink sql有什么方案实现吗？

感谢您的回复



--

Best,
Benchao Li