prometheus配置文件中的一些时间概念及名词解释
程序员文章站
2022-06-04 19:20:37
...
1、group by
举例:group_by: ['id','alertname']
出现在alertmanager.yml中,表示根据labels中的某一个或多个属性进行分组,以某个告警信息中的labels为例:
"labels":{
"alertname":"CPU使用率超限",
"beta_kubernetes_io_arch":"amd64",
"beta_kubernetes_io_os":"linux",
"cluster":"prod-kubernetes",
"container_name":"scope-agent
"cpu":"total",
"id":"/kubepods/besteffort/pod4862efd9-0a6e-11e9-a53f-066788000017/da98b52508ac2cc148cf816ff62357c8ca867c56a8e2e62b57d0c4fd9bfc3903",
"image":"sha256:de09b72e4a4f440f20fe6db755bfdc089bea1c70ed6c7acf0a22eeb40f836366",
"instance":"node-qiznap13",
"job":"kubernetes-cadvisor",
"kubernetes_io_hostname":"node-qiznap13
"name":"k8s_scope-agent_weave-scope-agent-92vzx_weave_4862efd9-0a6e-11e9-a53f-066788000017_1",
"namespace":"weave",
"pod_name":"weave-scope-agent-92vzx",
"severity":"critical"
}
group_by: ['id','alertname']
的意思是说将id和alertmanager相同的告警分成一组,每一个分组最后都会合成一条
信息在产生告警之后发送过来。这种方式可以有效减少告警消息的数量。
2、模板
Templating(模板) 标签和注释值可以使用控制台模板进行模板化。value保存警报实例的评估值。
# To insert a firing element's label values:
#labels后面能点出来的属性就是上面展示的labels所有的属性
{{ $labels.<labelname> }}
# To insert the numeric expression value of the firing element:
#查询出来的值,也就是超出阈值线的那个指标值
{{ $value }}
3、第一个是prometheus的容器,使用docker-enter
结合docker ps | grep prom
查出的信息一起,可以进入到容器内部(使用exit指令退出容器)。第二个则不行。
k8s_prometheus_prometheus-core
k8s_POD_prometheus-core
4、
for
[1m]
step=5m
5、Pending
注:修改策略文件reload的端口号为prometheus的端口号,修改alertmanager.yml文件后reload的端口号为alertmanager的端口号。
上一篇: JDK1.8源码中的HashMap
下一篇: JDK1.8新特性值Optional