最新消息:

DB数据库通用监控项衡量标准

IT技术 ipcpu 151浏览 0评论

运维团队的业务运维和DB运维是分离的,在业务运维看来,DB就是一个黑盒子,那么如何评估这个黑盒子是正常运作的呢?
鉴于我们使用的Prometheus监控,所以提出以下需求来衡量:

  1. DB的OS层面,需要有node_exporter监控覆盖
  2. 需要有DB数据库服务是否正常运行的up指标,服务是否重启的报警,或者端口存活的监控
  3. DB集群,需要有主备切换的监控,需要有主备同步的延迟的监控,从节点(集群节点)数据变化的监控
  4. 需要有衡量DB是否在正常工作,工作是否繁忙的QPS、TPS数据(或者写入、读取数据)
  5. 需要有衡量数据库是否变慢的平均响应时间的指标
  6. 需要有慢查询条数的报警
  7. 需要有数据库连接数利用率指标
  8. 缓存命中率指标

对于操作系统层面的存储,需要衡量其是否卡顿:

  1. IOPS利用率指标(提前锚定IOPS最大值)
  2. 磁盘读写延迟监控

转载请注明:IPCPU-网络之路 » DB数据库通用监控项衡量标准

发表我的评论
取消评论
表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址