prometheus-operator问题记录-部分nodeexporter无数据问题

原创已于 2025-06-08 08:56:50 修改 · 382 阅读

·

7

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2025-03-01 22:13:27 首次发布

问题描述

使用虚拟机部署的k8s集群，一键部署了prometheus-operator，在某些场景下，比如关机后开机，nodeexporter重启，在grafana面板会缺少部分集群节点的监控

问题采集

首先有节点有数据，排除采集链路问题，定位单点问题，通过top po 发现未上报数据的节点exporter的CPU会高于其他正常节点
pod未见异常日志
curl 节点IP:9100 异常节点的响应非常慢，怀疑是节点网络存在问题，通过同节点的svc nodeport测试发现curl nodeport响应没有问题，定位问题还是在服务本身
此时认为是metrics拉取数据超时，因为目前能看到curl已经很慢了，调整kube-state-metrics

kubectl edit servicemonitor kube-state-metrics -n monitoring
#检查这几项
spec:
  endpoints:
    - port: metrics
      interval: 10s       # 默认 30s，调整为 10s 采集指标频率，每10s采集1次
      scrapeTimeout: 5s   # 采集超时时间

将上面优化参数调整后，重建kube-state-metrics的pod，发现有节点添加上来了，但不是所有的，后面curl测试两个节点的9100端口发现长时间不通，本地也在监听，暂时重建pod恢复
kube-rbac-proxy的边车pod cpu用满了

------将ds的limits提高了CPU以后，看起来是正常了，但是实际上其他节点没有问题，还需要进一步调试，找下细节

引入新问题，node的指标阶段性获取失败
[root@master-1 ~]# kubectl top node
error: metrics not available yet

问题闭环：node-exporter资源配置CPU和MEM调大

    resources:
      limits:
        cpu: 256m
        memory: 256Mi
      requests:
        cpu: 10m
        memory: 20Mi

博客等级

码龄6年

27
原创

89
点赞

25
收藏

155
粉丝

关注

私信

热门文章

分类专栏

上一篇：: 麒麟系统误操作将/lib文件夹移除解决办法

下一篇：: influxdb数据库磁盘写满重启后写入报错no space left on device

最新评论

go-gin框架下载github-wsarecv: An existing connection was forcibly closed by the remote host
CSDN-Ada助手: Go 技能树或许可以帮到你：https://edu.csdn.net/skill/go?utm_source=AI_act_go
达梦DM8数据库替换Mysql数据库，详细操作
CSDN-Ada助手: 恭喜您撰写了这篇有关达梦DM8数据库替换Mysql数据库的详细操作的博客！非常感谢您为读者带来这样有益的信息。我相信您的经验和知识能够帮助更多的人，所以我建议您继续分享您的见解和经验。您可以考虑编写更多关于数据库方面的文章，以及分享一些实用技巧和最佳实践。期待您的下一篇文章！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
cowardly refusing to save to a terminal. Use the -o flag or redirect
CSDN-Ada助手: 恭喜用户写了第三篇博客！标题中的问题我也曾遇到过，感觉很棘手。不过，通过学习和实践，我渐渐明白了解决方法。希望用户能在下一篇博客中分享一下自己的解决思路和心得体会，让更多人受益。加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=ada，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148
二进制部署k8s改kubeadm部署记录
CSDN-Ada助手: 云原生入门技能树或许可以帮到你：https://edu.csdn.net/skill/cloud_native?utm_source=AI_act_cloud_native

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。