可以通过JobResultStore[1]来获取任务最终的状态,flink-kubernetes-operator也是这样来获取的
[1]. https://cwiki.apache.org/confluence/display/FLINK/FLIP-194%3A+Introduce+the+JobResultStore Best, Yang Weihua Hu <huweihua....@gmail.com> 于2023年3月22日周三 10:27写道: > Hi > > 我们内部最初版本是通过 cluster-id 来唯一标识一个 application,同时认为流式任务是长时间运行的,不应该主动退出。如果该 > cluster-id 在 Kubernetes 中查询不到,说明作业已经异常退出了,此时标记作业为异常。后续我们开发了特殊的 operator + > crd 来管理 pod 声明周期,防止 pod 快速退出。 > > 另外,作业状态还可以通过启用 history server[1] 来查看 > > [1] > > https://nightlies.apache.org/flink/flink-docs-master/docs/deployment/advanced/historyserver/ > > Best, > Weihua > > > On Wed, Mar 22, 2023 at 9:42 AM Shammon FY <zjur...@gmail.com> wrote: > > > Hi > > > > 你可以在你的提交平台启动后台任务定去向k8s查询作业状态,Flink也在设计支持作业状态汇报[1],目前正在讨论中 > > > > [1] > > > > > https://cwiki.apache.org/confluence/display/FLINK/FLIP-294%3A+Support+Customized+Job+Status+Listener > > > > Best, > > Shammon FY > > > > > > On Wed, Mar 22, 2023 at 8:54 AM casel.chen <casel_c...@126.com> wrote: > > > > > > > > Flink实时计算平台在k8s上以Application模式启动作业如何实时同步作业状态到平台?作业一旦crash失败就会被k8s回收到相关的pod,没法通过web > > > url去获取作业状态,有什么别的办法吗?通过metrics? 如果是的话具体是哪一个metric值呢? > > >