DB数据库通用监控项衡量标准
ipcpu 2年前 (2023-05-12) 177浏览 0评论
运维团队的业务运维和DB运维是分离的,在业务运维看来,DB就是一个黑盒子,那么如何评估这个黑盒子是正常运作的呢? 鉴于我们使用的Prometheus监控,所以提出以下需求来衡量: DB的OS层面,需要有node_exporter监控覆盖 需要有D...
ipcpu 2年前 (2023-05-12) 177浏览 0评论
运维团队的业务运维和DB运维是分离的,在业务运维看来,DB就是一个黑盒子,那么如何评估这个黑盒子是正常运作的呢? 鉴于我们使用的Prometheus监控,所以提出以下需求来衡量: DB的OS层面,需要有node_exporter监控覆盖 需要有D...
ipcpu 6年前 (2018-11-11) 2549浏览
Prometheus监控系统专题一、简介安装使用.md 一、Prometheus简介 Prometheus是一个开源的系统监控和报警工具,特点是 多维数据模型(时序列数据由metric名和一组key/value组成) 在多维度上灵活的查询语言...
ipcpu 7年前 (2018-07-25) 4124浏览
概述 dmesg是Linux中的输出系统错误的命令,比如OOM或者Kernel Panic都会显示在这里,因此监控dmesg的报错也极为重要。 使用Python编写检测脚本 #!/usr/bin/env python # -*- codin...
ipcpu 7年前 (2018-05-22) 21047浏览
Kafka消费积压Lag监控工具Burrow的使用.md 一、概述 Kafka是业内流行的日志队列处理软件,使用极为广泛,但是关于对Kafka的监控问题,网上的文章和相关的软件就比较少了。 KafkaManager算是几个开源软件里做的比较好的。可...
ipcpu 7年前 (2018-04-09) 3288浏览
Redis监控汇总二.md 好了,说完系统自带的,我们来看看开源redis监控都有哪些吧 首先推荐的是Facebook家的小工具,redis-faina 三、redis-faina redis-faina是一个通过解析redis的MONITOR命令...
ipcpu 7年前 (2018-04-08) 4980浏览
Redis监控汇总一.md 一、概述 对于任何运行在生产环境的软件,监控都是必不可少的一个环节。 我们在分析各种工具之前,先来看下redis都有哪些指标需要关注和监控。 Redis监控的用途有两种,一种是类似于zabbix,监控指标并用来报警,另外一...
ipcpu 7年前 (2018-03-02) 4885浏览
Flume进阶Interceptor和监控.md 一、Flume的Interceptor Flume中的拦截器(interceptor),用户Source读取events发送到Sink的时候,在events header中加入一些有用的信息,或者对e...
ipcpu 8年前 (2017-06-27) 5276浏览
Zabbix使用Python检查Haproxy状态页面.md 概述 网上有很多使用zabbix监控haproxy的脚本,但大多数都使用的socket方式,而haproxy的stats页面页面我们经常需要访问的,所以我们这次使用python来抓取hap...
ipcpu 8年前 (2017-05-12) 4979浏览
引入 在openstack私有云平台部署了Zabbix后,发现承载云主机的物理机(CentOS7),zabbix监控图有些异常,如下,CPU利用率这张图默认情况应该是图像占满100%的,而这里却只有不到80%。 解决 一开始怀疑是Zabbix客户端...
ipcpu 10年前 (2015-07-03) 2945浏览
zabbix磁盘报警的二次判断.md 一般对于较大的磁盘来说,剩余10%仍然有好几百G的空间可以使用,所以可以使用剩余磁盘大小二次判断。 如下: #@Free disk space is less than 10% on volume {#FSN...