Prometheus rules配置

news/2024/5/19 0:30:50 标签: Prometheus, 普罗米修斯告警规则

1、前提

在前面的文章——Prometheus搭建》中,我们安装好了prometheus,并确认配置正确,web中也能查看到监控的机器情况,现在我们就来尝试制定告警规则,监控我们的机器和服务。

2、配置规则

默认的prometheus配置文件中,rules section并没有配置规则,因此我们需要添加新的规则,

[root@centos74 prometheus]# cat /usr/local/prometheus/prometheus.yml 
...
rule_files:
  - "rules/*.yml"

这里我们将告警规则定义在目录/usr/local/prometheus/rules/下,便于管理。

作为测试,我们添加一条对于内存的监控, 可用内存小于一半时发出HighMemoryUsage的告警。这里只是为了容易触发,实际环境中该比值会小得多。

[root@centos74 rules]# cat /usr/local/prometheus/rules/node_health.yml 
groups:
- name: node_health
  rules:
  - alert: HighMemoryUsage
    expr: node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes < 0.5
    for: 1m
    labels:
      severity: warning
    annotations:
      summary: High memory usage

其中,

  • name 定义该条rule名称
  • alert 定义该告警名称
  • expr 定义触发告警的条件,通过prometheus的语句
  • for 定义告警从产生到发送的等待时间
  • labels 定义标签
  • annotations 定义说明内容

添加完规则后,我们需要reload下配置,让我们的规则和刚才修改的prometheus.yml生效。

systemctl reload prometheus

3、查看告警

prometheus的web端能够看到告警情况,我们等待一两分钟,就能在web上看到以下告警,
在这里插入图片描述告警分为以下几种,

  • Inactive 未触发告警
  • Pending 触发了,但是还处于我们定义的for等待时间内
  • Firing 已触发且发送的告警

同时注意Labels的内容,后续使用Alertmanager会使用这几个字段用告警分组以及告警信息发送。

4、查看告警规则

可以在web上直接查看系统定义的告警规则,点击Status菜单,在下拉选项列表中选择Rules即可,其实这个内容和刚才告警的详情是一样。
在这里插入图片描述


http://www.niftyadmin.cn/n/1035302.html

相关文章

自定义屏幕中ALV 双击事件怎样触发屏幕的PAI(cl_gui_cfw=set_new_ok_code)

使用方法如下&#xff1a; * Trigger PAICALL METHOD cl_gui_cfw>set_new_ok_codeEXPORTINGnew_code DB_CLICK. 使用实例如下&#xff1a; 在OOALV的双击时间中定义新的OK_CODE METHOD handle_double_click_above.PERFORM frm_handle_double_click_above CHANGING e_row…

Prometheus配置和使用Alertmanager发送告警至企业微信

注&#xff1a;本文基于CentOS 7.4编写 1、准备工作 1.1 创建应用 注册企业微信&#xff0c;这个不细说。注册完成后&#xff0c;点击应用管理->应用->创建应用 1.2 获取应用ID和秘钥 按照要求创建应用后&#xff0c;点击创建的应用就能看到我们的应用id和秘钥&…

通过BAPI方式展示长文本ADA_POPUP_WITH_TABLE

BAPI测试如下&#xff1a;结果DATA:BEGIN OF wa_info,info TYPE char72, END OF wa_info, it_info LIKE TABLE OF wa_info.CALL FUNCTION ADA_POPUP_WITH_TABLEEXPORTINGstartpos_col 1startpos_row 1titletext 长文本展示测试 * WORDWRAP_POSITION …

Prometheus Alertmanager告警模板

1、告警模板 关于Alertmanager的告警模板&#xff0c;我们以上篇《Prometheus配置和使用Alertmanager发送告警至企业微信》的模板为例&#xff0c;对其做个说明&#xff0c; [rootcentos74 home]# cat /usr/local/prometheus/alertmanager/wechat.tmpl {{ define "wecha…

LRU链表及LRU缓存

注&#xff1a;本文分析基于linux-4.18.0-193.14.2.el8_2内核版本&#xff0c;即CentOS 8.2 1、 关于LRU LRU即Least recently used&#xff0c;也就是最近最少使用&#xff0c;一般用作缓存淘汰上&#xff0c;它的核心思想是——如果一个数据在最近一段时间没有被访问到&…

kswapd进程工作原理(一)——初始化及触发

注&#xff1a;本文分析基于linux-4.18.0-193.14.2.el8_2内核版本&#xff0c;即CentOS 8.2 1、关于kswap进程 kswap用于在内存不足时进行内存回收&#xff0c;每个NUMA内存节点会有一个kswapd进程&#xff0c; [rootlocalhost ~]# numactl -H available: 2 nodes (0-1) nod…

kswapd进程工作原理(二)——回收内存上半部

注&#xff1a;本文分析基于linux-4.18.0-193.14.2.el8_2内核版本&#xff0c;即CentOS 8.2 在上篇文章——kswapd进程工作原理(一)中&#xff0c;我们分析了kswapd进程的初始化以及触发场景&#xff0c;那kswap到底是怎么回收内存&#xff0c;回收哪些内存呢&#xff0c;我们…

kswapd进程工作原理(三)——回收LRU链表

注&#xff1a;本文分析基于linux-4.18.0-193.14.2.el8_2内核版本&#xff0c;即CentOS 8.2 在上篇文章——kswapd进程工作原理(二)——回收内存上半部中&#xff0c;我们分析了kswapd进程的具体回收过程&#xff0c;今天我们再继续往下&#xff0c;看看kswapd是如何回收LRU链…