Hi

我们内部最初版本是通过 cluster-id 来唯一标识一个 application,同时认为流式任务是长时间运行的,不应该主动退出。如果该
cluster-id 在 Kubernetes 中查询不到,说明作业已经异常退出了,此时标记作业为异常。后续我们开发了特殊的 operator +
crd 来管理 pod 声明周期,防止 pod 快速退出。

另外,作业状态还可以通过启用 history server[1] 来查看

[1]
https://nightlies.apache.org/flink/flink-docs-master/docs/deployment/advanced/historyserver/

Best,
Weihua


On Wed, Mar 22, 2023 at 9:42 AM Shammon FY <zjur...@gmail.com> wrote:

> Hi
>
> 你可以在你的提交平台启动后台任务定去向k8s查询作业状态,Flink也在设计支持作业状态汇报[1],目前正在讨论中
>
> [1]
>
> https://cwiki.apache.org/confluence/display/FLINK/FLIP-294%3A+Support+Customized+Job+Status+Listener
>
> Best,
> Shammon FY
>
>
> On Wed, Mar 22, 2023 at 8:54 AM casel.chen <casel_c...@126.com> wrote:
>
> >
> Flink实时计算平台在k8s上以Application模式启动作业如何实时同步作业状态到平台?作业一旦crash失败就会被k8s回收到相关的pod,没法通过web
> > url去获取作业状态,有什么别的办法吗?通过metrics? 如果是的话具体是哪一个metric值呢?
>

回复