您好! 我在使用prometheus监控flink时发现一个问题不知是不是bug,反映如下
版本信息 Flink 1.9.1 Prometheus 2.18 pushgateway 1.2.0 问题: 配置 metrics.reporter.promgateway.randomJobNameSuffix为false后,部分metrics不能正确的push到pushgateway里。具体表现是,部分metrics(主要是jobmanager相关,如 flink_jobmanager_Status_JVM_CPU_Load ),无法持久的存在pushgateway中,频繁刷新发现指标一会儿消失,一会儿又出现。还有部分指标直接丢失了,如 flink_jobmanager_job_fullRestarts。 metrics.reporter.promgateway.randomJobNameSuffix设置为true时,功能是正常的。 以下是我的相关配置: metrics.reporter.promgateway.class: org.apache.flink.metrics.prometheus.PrometheusPushGatewayReporter metrics.reporter.promgateway.host: localhost metrics.reporter.promgateway.port: 9091 metrics.reporter.promgateway.jobName: cluster1 metrics.reporter.promgateway.randomJobNameSuffix: *false* metrics.reporter.promgateway.deleteOnShutdown: *false* 望能解决我的疑惑,谢谢~~~~
