08-prometheus监控的告警通知-alertmanager组件工具

news/2024/5/19 2:03:01 标签: prometheus

一、概述

        prometheus通过规则文件对比抓取到的数据,来判断是否触发告警,我们通过配置告警的工具altermanager进行告警通知;

        规则文件,写的就是,当我们获取到的PromeQL的值到达一个设置的规则后,触发告警;

        也就是说,规则文件,是出发告警的关键,而altermanager是告警的手段、工具。

二、安装部署alertmanager工具

1,软件包获取方式

下载地址:

wget https://github.com/prometheus/alertmanager/releases/download/v0.26.0/alertmanager-0.26.0.linux-amd64.tar.gz

为了方便学习,我给大家也准备了百度云盘的安装包:

链接:https://pan.baidu.com/s/1BgN8Lc5zrqakX8XNEwxh4Q?pwd=o5g7 
提取码:o5g7

2,上传解压软件包

[root@prometheus-server32 ~]# rz -E
[root@prometheus-server32 ~]# mkdir -pv /prometheus/softwares/

[root@prometheus-server32 ~]# tar xf alertmanager-0.26.0.linux-amd64.tar.gz -C /prometheus/softwares/

[root@prometheus-server32 ~]# ln -svf /prometheus/softwares/alertmanager-0.26.0.linux-amd64/ /prometheus/softwares/alertmanager

[root@prometheus-server32 ~]# cd /prometheus/softwares/alertmanager/

三、配置alertmanager邮件告警

1,编辑alertmanager配置文件

[root@prometheus-server32 ~]# cat /prometheus/softwares/alertmanager/alertmanager.yml 
#一、发件人信息配置
global:
  #解析失败超时时间;
  resolve_timeout: 5m
  #【发件人】邮箱
  smtp_from: '626080079@qq.com'
  #【邮箱官方主机】地址及端口
  smtp_smarthost: 'smtp.qq.com:465'
  #【发件人】邮箱
  smtp_auth_username: '626080079@qq.com'
  #【发件人】邮箱授权码
  smtp_auth_password: 'ubgotgvzrdgkbfcj'
  #发送信息是否tls加密
  smtp_require_tls: false
  smtp_hello: 'qq.com'
#二、报警的间隔信息配置;
route:
  group_by: ['alertname']
  group_wait: 5s
  group_interval: 5s
  #重复报警的间隔时间,如果报警问题没有解决,则会间隔指定的时间继续触发报警,比如5分钟;
  repeat_interval: 5m
  #采用什么报警方式?本次学习,我们使用邮箱;
  receiver: 'email'
#三、接收告警的目标信息编辑;谁来接收告警?
receivers:
#定义接收者名称
- name: 'email'
  email_configs:
  #【收件人】
  - to: '626080079@qq.com'
    send_resolved: true
inhibit_rules:
  - source_match:
      #匹配的告警级别
      severity: 'critical'
    target_match:
      severity: 'warning'
    equal: ['alertname', 'dev', 'instance']

2,启动alertmanager

[root@prometheus-server32 ~]# ./prometheus/softwares/alertmanager/alertmanager

3,浏览器访问9093端口

至此,告警的中间件就配置完成了;

四、配置prometheus报警规则

1,编辑配置文件

[root@prometheus-server31 ~]# vim /prometheus/softwares/prometheus-2.37.8.linux-amd64/prometheus.yml 

global:
  scrape_interval: 3s
  evaluation_interval: 15s

#####################################
#告警的中间件地址(alertmanager的访问地址);
alerting:
  alertmanagers:
    - static_configs:
        - targets:
            - 10.0.0.32:9093
#规则文件在哪里?路径;
rule_files:
  - "/prometheus/softwares/rules.yml"
#####################################

scrape_configs:
  - job_name: "prometheus-alert-rule"
    static_configs:
    - targets: ["10.0.0.41:9100"]

2,编辑规则文件

        规则文件内容主要目的是:

        1,当监控数据,达到什么数值后。触发alertmanager的报警;

        2,报警的内容信息是什么?

[root@prometheus-server31 ~]# vim /prometheus/softwares/rules.yml

groups:
- name: xinjizhiwa-alert
  rules:
  - alert: 41节点挂掉啦          
    #当promeQL这个语句=0时(节点挂掉),开始报警
    expr: up{instance="10.0.0.41:9100"} == 0
    #连续3s=0才触发报警;
    for: 3s
    labels:
      prometheus: xinjizhiwa
      #被监控节点ip
      node: 10.0.0.41
    annotations:
      summary: "{{ $lables.instance }} 已停止运行超过 3s!"

3,prometheus的配置文件语法检查

[root@prometheus-server31 prometheus-2.37.8.linux-amd64]# ./promtool check config prometheus.yml 

4,重新加载prometheus服务

curl -X POST http://10.0.0.31:9090/-/reload

五、模拟被监控项挂掉

[root@prometheus-node41 ~]# systemctl stop node-exporter.service

等待几秒钟,收到告警邮件

至此,alertmanager邮件告警就学习完毕了。


http://www.niftyadmin.cn/n/5409225.html

相关文章

BAT常见的20道Android面试题详解,我的头条面试经历分享

二、面试 下面主要列举下在面试过程中遇到过的剑指 offer 原题或者类似问题,大家应该清楚,面试过程中遇到原题不要太高兴,而刷剑指 offer 就能让遇到原题的可能性大大增加。 1.字节跳动春招 面试题 68 - II. 二叉树的最近公共祖先 2.京东…

DHCP自动获取IP地址实验(华为)

思科设备参考&#xff1a;DHCP自动获取IP地址实验&#xff08;思科&#xff09; 一&#xff0c;实验目的 路由器搭载DHCP&#xff0c;让PC通过DHCP自动获取IP地址 二&#xff0c;不划分vlan--全局地址池 实验拓扑 配置命令 Router <Huawei>system-view [Huawei]ip po…

Linux运维:在线/离线安装Telnet客户端和Telnet服务

Linux运维&#xff1a;在线/离线安装Telnet客户端和Telnet服务 前言1.1 在线安装Telnet1.2 离线安装Telnet1.3 Telnet服务有关的命令 &#x1f496;The Begin&#x1f496;点点关注&#xff0c;收藏不迷路&#x1f496; 前言 Telnet是一种用于远程登录到其他计算机的协议&…

易基因:NAR:RCMS编辑系统在特定细胞RNA位点的靶向m5C甲基化和去甲基化研究|项目文章

喜讯&#xff01;易基因表观转录组学RNA-BS技术服务见刊《核酸研究》 大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 2024年2月15日&#xff0c;吉林大学张涛、赵飞宇、李金泽为共同第一作者&#xff0c;吉林大学李占军、隋婷婷及赖良…

Kosmos-2: 在多模态大语言模型中引入基准和指代能力

Kosmos-2: 在多模态大语言模型中引入基准和指代能力 FesianXu 20240304 at Baidu Search Team 前言 之前笔者在博文中介绍过kosmos-1模型 [1]&#xff0c;该模型脱胎于MetaLM采用『因果语言模型作为通用任务接口』的思想&#xff0c;采用了多种形式的多模态数据进行训练得到。…

蓝桥杯2013年-带分数(暴力全排列check方案数)

题目描述 100 可以表示为带分数的形式&#xff1a;100 3 69258 / 714。 还可以表示为&#xff1a;100 82 3546 / 197。 注意特征&#xff1a;带分数中&#xff0c;数字1~9分别出现且只出现一次&#xff08;不包含0&#xff09;。 类似这样的带分数&#xff0…

安卓app软件开发的费用

我们公司总结的开发价格根据安卓APP&#xff0c;苹果APP行业的报价&#xff0c;开发的APP软件费用主要受到两个方面的影响。安卓和苹果APP软件应用的复杂性&#xff0c;第二个是定制开发的APP软件&#xff0c;开发成本和人员的投入成本&#xff0c;以下就是不同的报价费用是怎么…

前端WebRTC局域网1V1视频通话

基本概念 WebRTC&#xff08;Web Real-Time Communications&#xff09; 网络实时通讯&#xff0c;它允许网络应用或者站点&#xff0c;在不借助中间媒介的情况下&#xff0c;建立点对点&#xff08;Peer-to-Peer&#xff09;的连接&#xff0c;实现视频流和音频流或者其他任…