prometheus和node_exporter中的磁盘监控
ipcpu 4年前 (2021-04-02) 7861浏览 0评论
prometheus和node_exporter中的磁盘监控.md 对于磁盘问题,我们主要关注以下几个指标: 磁盘空间使用率、磁盘inode使用率(df -h和df -i命令) 磁盘读写次数IOPS (iostat中的r/s、w/s) ...
ipcpu 4年前 (2021-04-02) 7861浏览 0评论
prometheus和node_exporter中的磁盘监控.md 对于磁盘问题,我们主要关注以下几个指标: 磁盘空间使用率、磁盘inode使用率(df -h和df -i命令) 磁盘读写次数IOPS (iostat中的r/s、w/s) ...
ipcpu 6年前 (2018-07-25) 4101浏览
概述 dmesg是Linux中的输出系统错误的命令,比如OOM或者Kernel Panic都会显示在这里,因此监控dmesg的报错也极为重要。 使用Python编写检测脚本 #!/usr/bin/env python # -*- codin...
ipcpu 7年前 (2018-04-09) 3265浏览
Redis监控汇总二.md 好了,说完系统自带的,我们来看看开源redis监控都有哪些吧 首先推荐的是Facebook家的小工具,redis-faina 三、redis-faina redis-faina是一个通过解析redis的MONITOR命令...
ipcpu 7年前 (2018-04-08) 4962浏览
Redis监控汇总一.md 一、概述 对于任何运行在生产环境的软件,监控都是必不可少的一个环节。 我们在分析各种工具之前,先来看下redis都有哪些指标需要关注和监控。 Redis监控的用途有两种,一种是类似于zabbix,监控指标并用来报警,另外一...
ipcpu 7年前 (2017-10-15) 7615浏览
zabbix agent cpu占用100%排查.md 发现问题 运维同学发现某几台机器zabbix agent占用了cpu达到了100%,如下图。 初步分析和猜测 因该服务器TCP连接数过多,超过10万,高峰期可达20万。ss统计数据如下 [r...
ipcpu 8年前 (2017-06-27) 5257浏览
Zabbix使用Python检查Haproxy状态页面.md 概述 网上有很多使用zabbix监控haproxy的脚本,但大多数都使用的socket方式,而haproxy的stats页面页面我们经常需要访问的,所以我们这次使用python来抓取hap...
ipcpu 8年前 (2017-05-12) 4957浏览
引入 在openstack私有云平台部署了Zabbix后,发现承载云主机的物理机(CentOS7),zabbix监控图有些异常,如下,CPU利用率这张图默认情况应该是图像占满100%的,而这里却只有不到80%。 解决 一开始怀疑是Zabbix客户端...
ipcpu 8年前 (2017-04-03) 6686浏览
zabbix使用python获取阿里云SLB带宽.md 阿里云SDK 阿里云目前提供了很多的SDK,并且可以使用在线调试工具,虽然有些bug https://develop.aliyun.com/tools/sdk?#/python 在线调试工具 ...
ipcpu 9年前 (2016-04-18) 8743浏览 1评论
docker容器监控的实现.md 说明 本文写于2015年,所有PAAS平台相关内容都已经在2015Q3完成,当时使用的docker版本为1.6.2,虽然docker新版本发布很快,但是下面提到的监控相关的内容大致相同。 一、 docker容器有哪...
ipcpu 9年前 (2016-01-17) 12112浏览 0评论
open-falcon的使用一.md 一、概述 open-falcon是小米公司运维部开源的监控产品,open-falcon 是一套完整的解决方案,可以很方便的在不同的公司来部署使用,可以很方便的监控10台服务,也可以扩展到10万台服务器。 二、架...