使用Prometheus+Alertmanage+Cloud Alert 实现电话告警

news/2024/5/19 0:57:22 标签: prometheus

先决条件

1.先决条件Prometheus部署完成,

2.AlertManager部署完成

3.不知道咋部署的参见(Prometheus-Alertmanage钉钉实现告警-CSDN博客)

进入正题

注册ca账号

进入告警首页配置相关配置项

配置Prometheus报警使用的触发器(就是一个网站的token)

确认并保存生成的token信息

这里说明下,生成的token用于配置Alertmanager的告警配置文件.

将配置配置我呢间中的内容粘贴到Alertmanager-config文件中.

配置Alertmanage告警配置信息

这里注意下复制后的格式和缩进,容易出现yaml错误的情况

[root@node1-prome /zpf/k8s/prometheus/docker-prometheus/alertmanager]$cat config.yml
global:
  #163服务器
  smtp_smarthost: 'smtp.qq.com:465'
  #发邮件的邮箱
  smtp_from: '348264747@qq.com'
  #发邮件的邮箱用户名,也就是你的邮箱
  smtp_auth_username: '348264747@qq.com'
  #发邮件的邮箱密码
  smtp_auth_password: 'swxuighfghijbiea'
  #进行tls验证
  smtp_require_tls: false

route:
  group_by: ['warn']
  # 当收到告警的时候,等待group_wait配置的时间,看是否还有告警,如果有就一起发出去
  group_wait: 10s
  #  如果上次告警信息发送成功,此时又来了一个新的告警数据,则需要等待group_interval配置的时间才可以发送出去
  group_interval: 10s
  # 如果上次告警信息发送成功,且问题没有解决,则等待 repeat_interval配置的时间再次发送告警数据
  repeat_interval: 10m
  # 全局报警组,这个参数是必选的
  receiver: 'ca'  #这里是匹配告警触发器.要与下面的触发器名称保持一致

receivers:
  - name: 'ca'
    webhook_configs:
      - url: 'http://api.aiops.com/alert/api/event/prometheus/78c652256xxxxxx'
        send_resolved: true

inhibit_rules:
 - source_match:
     severity: 'critical'
   target_match:
     severity: 'warning'
   equal: ['alertname', 'dev', 'instance']

配置ca平台告警分配策略

检查创建结果

创建告警通知策略

检查通知策略

修改监控配置(这里是为了测试报警是否成功)

groups:
- name: node-exporter
  rules:
  - alert: HostOutOfMemory
    expr: node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes * 100 < 10
#    expr: node_memory_MemAvailable_bytes / node_memory_MemTotal_bytes * 100 > 10
    for: 1m
    labels:
      severity: warning
    annotations:
      summary: "主机内存不足,实例:{{ $labels.instance }}"
      description: "内存可用率<10%,当前值:{{ $value }}"
#      description: "内存可用率>10%,当前值:{{ $value }}"
这里将原来的正确告警修改成了错误的.就会出发报警服务.

重启Alertmanage+Prometheus

#重启Prometheus
$curl -X POST http://localhost:9090/-/reload
#重启Alertmanage
$curl -X POST http://localhost:9093/-/reload

验证告警触发结果

接下来就是最终验证.查看告警是否成功.

Prometheus提示告警.

在Cloud ALert上查查看告警情况

手机接收到报警电话

告警发送成功.

完结撒花


http://www.niftyadmin.cn/n/5311802.html

相关文章

GBASE南大通用-CommandType 属性

获取或设置一个值&#xff0c;指明命令的类型。  语法 [Visual Basic] Public Overrides Property CommandType As CommandType Get Set [C#] public override CommandType CommandType { get; set; }  属性值 GBASE南大通用CommandType 可以设置的值有&#xff1…

外包做了1个月,技术退步一大半了。。。

先说一下自己的情况&#xff0c;本科生&#xff0c;20年通过校招进入深圳某软件公司&#xff0c;干了接近4年的功能测试&#xff0c;今年年初&#xff0c;感觉自己不能够在这样下去了&#xff0c;长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测试…

Halcon 灰度区域的面积和中心area_center_gray

Halcon 灰度区域的面积和中心 与根据形状特征求面积的方法类似&#xff0c;灰度值图像也可以使用算子直接求出区域的面积和重心。 这里用area_center_gray算子计算一幅灰度值图像的面积和中心。 area_center_gray算子与area_center算子类似&#xff0c;都可以求区域的中心。但…

使用postman发送请求,提示Content type ‘multipart/form-data not supported

1、原因&#xff1a;后端通过RequestBody 的方式接收参数&#xff0c;不能通过form-data方式传参&#xff0c;每一个请求必须是通过实体对象进行传参&#xff0c;需要改为使用json传参

【MATLAB第89期】基于MATLAB的差分自回归滑动平均模型ARIMA时间序列预测模型含预测未来

【MATLAB第89期】基于MATLAB的差分自回归滑动平均模型ARIMA时间序列预测模型含预测未来 往期文章 【MATLAB第82期】基于MATLAB的季节性差分自回归滑动平均模型SARIMA时间序列预测模型含预测未来 一、模型介绍 1、模型简介 差分自回归移动平均模型&#xff08;Autoregressiv…

sentinel相关问题及答案(2024)

数据结构和算法 1、什么是哨兵值&#xff1f;它在算法中是如何使用的&#xff1f; 哨兵值是在计算中用作标记或信号的特殊值&#xff0c;通常用于指示数据结构的边界或结束&#xff0c;或者作为检测特定条件的触发器。在算法中&#xff0c;哨兵值的使用可以简化代码并提高效…

MySql8的那些不为人知的秘密揭晓

前言 MySQL 8.0 是MySQL数据库的一个重大版本更新&#xff0c;带来了许多改进和新功能。以下是MySQL 8.0的一些主要改进&#xff1a; 事务控制&#xff1a;引入了原子性、一致性、隔离性和持久性&#xff08;ACID&#xff09;的事务支持。该版本的MySQL引入了新的事务日志存储引…

CMakeLists.txt 怎么写

写程序的大体步骤就是&#xff1a;首先用编辑器编写源代码&#xff0c;如.c文件&#xff1b;然后经过预处理、编译和汇编生成可重定位目标文件&#xff0c;也就是.o&#xff08;Unix下&#xff09;文件&#xff1b;最后通过链接器将所有的.o以及用到的库文件链接成可执行文件。…