通过 prometheus operator 采集监控指标:
ServiceMonitor
。通过 Service
采集PodMonitor
。采集 Pod
安装 prometheus operator
参数说明:
values。可通过 --values additional-values
批量覆盖参数,也可通过 --set xxx=yyyy
覆盖参数
命名空间
禁用 AlertManager。--set alertmanager.enabled=false
禁用 Grafana。--set grafana.enabled=false
卸载 prometheus operator
暴露 Flink metrics 端口,供 prometheus 采集监控信息
prometheus operator 通过 ServiceMonitor
采集 Flink metrics
通过 prometheus 监控 ServiceMonitor
。prometheus 默认只监控当前 namespace 下的 ServiceMonitor
,如果要监控其他命名空间,可以通过 spec.serviceMonitorNamespaceSelector
实现。
使用 PodMonitor
监控 flink jobs pod 可以参考:Using PodMonitors