最新消息:

标签:Prometheus

DB数据库通用监控项衡量标准
IT技术

DB数据库通用监控项衡量标准

ipcpu 2年前 (2023-05-12) 151浏览 0评论

运维团队的业务运维和DB运维是分离的,在业务运维看来,DB就是一个黑盒子,那么如何评估这个黑盒子是正常运作的呢? 鉴于我们使用的Prometheus监控,所以提出以下需求来衡量: DB的OS层面,需要有node_exporter监控覆盖 需要有D...

Prometheus联邦采集超时导致监控图像出现断点
IT技术

Prometheus联邦采集超时导致监控图像出现断点

ipcpu 2年前 (2023-04-07) 162浏览 0评论

近期我们发现监控图像会不定期的出现断点情况,图像上一根连续的曲线突然就断开了,如下 经过排查发现,数据是通过Prometheus的联邦模式从别的Prometheus实例采集上来的,于是我们去原实例上进行查询,发现原始数据没有断点,如下图, 那么问...

prometheus数据模型和存储机制
IT技术

prometheus数据模型和存储机制

ipcpu 3年前 (2021-09-19) 2400浏览 0评论

一、概述 本文整理了Prometheus的一些数据模型和存储机制,涉及到metric names,labels,samples,Series,Chunk、HeadChunk、Block等概念。 对于理解Prometheus运行机制,理解常见的Pro...

Thanos-Prometheus的扩展好伙伴
IT技术

Thanos-Prometheus的扩展好伙伴

ipcpu 3年前 (2021-09-08) 3341浏览 1评论

一、Thanos概述: Thanos主要用于解决大规模prometheus部署、增强prometheus高可用的工具。 项目地址 https://github.com/thanos-io/thanos 二、Thanos架构 从官方github中可以...

prometheus和node_exporter中的磁盘监控
Linux

prometheus和node_exporter中的磁盘监控

ipcpu 4年前 (2021-04-02) 7860浏览 0评论

prometheus和node_exporter中的磁盘监控.md 对于磁盘问题,我们主要关注以下几个指标: 磁盘空间使用率、磁盘inode使用率(df -h和df -i命令) 磁盘读写次数IOPS (iostat中的r/s、w/s) ...

大规模环境下prometheus的扩展方向
IT技术

大规模环境下prometheus的扩展方向

ipcpu 4年前 (2021-03-12) 1555浏览 0评论

一、概述 随着prometheus在越来越多的生产环境中推广开来,监控项series必然会越来越多,OOM时常会发生,扩容就会成为常态,单实例运行的prometheus瓶颈凸显,扩展成为大势所趋。本文来讨论下prometheus扩展的一些方向。 本...

使用alertmanager的API接口发送报警消息
IT技术

使用alertmanager的API接口发送报警消息

ipcpu 4年前 (2021-02-10) 2562浏览 0评论

使用alertmanager的API接口发送报警消息.md Alertmanager提供了API供其他程序调用,目前版本是V2,文档比较少,仅在github中有个帮助页面。我们这里整理下最常用的几个接口。调试工具我使用的Postman。 GET /a...

prometheus删除指定数据
IT技术

prometheus删除指定数据

ipcpu 4年前 (2020-10-08) 2417浏览 0评论

prometheus删除指定数据.md Prometheus 在2.X版本后提供了数据删除功能、数据清理功能,想要使用 API 需要先添加启动参数 --web.enable-admin-api 打开这个接口,默认这个接口是关闭的。 一、数据删除 /a...