protheus hang住 的问题,卡在TSDB过程中无法启动

news/2024/5/19 0:30:59 标签: prometheus

问题:k8s发生pods迁移,prometheus重启,重启过程中CPU和内存同时疯狂增加,最后报pods网络问题。
错误分析
prometheus TSDB写错误,所以重启会疯狂攫取CPU内存资源,最后也无法读取TSDB数据,最终把节点系统资源耗尽,影响别的服务。
以至于在此错误理解下,在prometheus部署服务中加了limits选项,限制CPU为3.memory为20Gi.本意是为了保护系统资源,其实是进入了一个误区,prometheus重新组合需要的系统资源不够,反而造成prometheus无法启动。
正确理解
protheus重启需要组合大量的TSDB资源,CPU会瞬间增加到13核左右,并需要大概50G 内存资源。此刻组合DB资源的过程中,kubelet会反馈pods网络连接问题,实际上是假象,prometheus已经提供服务了。
解决

  • prometheus部署到CPU和内存比较大的节点上。
  • prometheus limits资源要给大点limits限制cpu:20 ,memory:100Gi
  • 遇到pods报网络错误可忽略,稍等几分钟会恢复正常。

http://www.niftyadmin.cn/n/1421435.html

相关文章

华为s5720默认用户名和密码_华为交换机s5720s-28p-LI-AC默认用户名和密码是什么?...

建议使用华为iknow智能机器人获取类似问题的帮助信息,iknow智能机器人地址:欢迎访问华为 企业业务 智能问答 在线客服​support.huawei.com以下内容均来自华为iknow智能机器人:S系列和E系列交换机(S1700除外)可以通过Console口、telnet、web网…

查看Linux网卡的UUID

# yum provides “*/nmcli” # yum -y install NetworkManager #systemctl start NetworkManager #nmcli con

NGUI翻牌

using UnityEngine; using System.Collections;public class TweenFlipCARDS : MonoBehaviour {/// <summary> 牌正面 </summary>public GameObject positive;/// <summary> 牌背面 </summary>public GameObject reverse;/// <summary> 半圈时间…

默认目录在哪_(02)ASP如何设定主目录和默认文档

本节主要介绍更改ASP文件存储主目录&#xff0c;即在服务器计算机上的物理路径和设定默认访问文档两个问题。这两个问题一解决&#xff0c;我们就可以进行程序设计的动态网页互动环节了。一&#xff0e; 更改主目录1. 以Windows 7操作系统为例&#xff0c;它的IIS默认的主目录是…

python csv写入sql_python - 使用Python将Csv文件写入SQL Server数据库中的现有表中 - SO中文参考 - www.soinside.com...

我试图将CSV文件插入SSMS数据库表中已经存在的表中。我的数据中有一个数据列。但是&#xff0c;当我尝试插入数据时&#xff0c;我一直收到此错误。请告诉我我在哪里做错了&#xff0c;因为服务器连接和从数据库提取数据都很好。下面是代码。with open("combine.csv"…

k8s pods中shell 脚本里无法调出jobs的后台进程

问题&#xff1a;k8s pods中用户执行的job经常要跑多线程&#xff0c;所以会使用 &方式&#xff0c;这时候job直接执行完当前shell退出了&#xff0c;造成用户实际执行的任务没有执行。 分析&#xff1a;此问题刚开始采用jobs方式判断&#xff0c;发现服务器在脚本里执行jo…

ThinkPhp学习11

ThinkPhp学习11 原文:ThinkPhp学习11一、模板的使用 &#xff08;重点&#xff09; a、规则 模板文件夹下[TPL]/[分组文件夹/][模板主题文件夹/]和模块名同名的文件夹[Index]/和方法名同名的文件[index].html&#xff08;.tpl&#xff09; 更换模板文件的后缀名&…

Failed to start Ceph object storage daemon osd.14

问题&#xff1a;ceph集群osd变为down的状态&#xff0c;并且重启osd也一直失败。 分析&#xff1a; [rootshnode183 ~]# systemctl status ceph-osd14 ● ceph-osd14.service - Ceph object storage daemon osd.14Loaded: loaded (/usr/lib/systemd/system/ceph-osd.service;…