大规模环境下prometheus的扩展方向
ipcpu 4年前 (2021-03-12) 1555浏览 0评论
一、概述 随着prometheus在越来越多的生产环境中推广开来,监控项series必然会越来越多,OOM时常会发生,扩容就会成为常态,单实例运行的prometheus瓶颈凸显,扩展成为大势所趋。本文来讨论下prometheus扩展的一些方向。 本...
ipcpu 4年前 (2021-03-12) 1555浏览 0评论
一、概述 随着prometheus在越来越多的生产环境中推广开来,监控项series必然会越来越多,OOM时常会发生,扩容就会成为常态,单实例运行的prometheus瓶颈凸显,扩展成为大势所趋。本文来讨论下prometheus扩展的一些方向。 本...
ipcpu 6年前 (2018-11-11) 2521浏览
Prometheus监控系统专题一、简介安装使用.md 一、Prometheus简介 Prometheus是一个开源的系统监控和报警工具,特点是 多维数据模型(时序列数据由metric名和一组key/value组成) 在多维度上灵活的查询语言...
ipcpu 7年前 (2017-08-27) 718浏览
利用zabbix的LLD可以实现端口的自动发现和添加监控 Shell脚本如下 #!/bin/bash portarray=(`sudo netstat -tnlp|egrep -i "$1"|awk {'print $4'}|awk -F':' ...
ipcpu 9年前 (2016-06-09) 2600浏览
在实际的使用当中,经常会出现一些指标,需要跟昨日进行对照的情况。 zabbix在1.8.2以后也考虑到了这点,增加了一个timeshift功能。 目前只有在触发器中支持: 例如官方提供的例子: 触发器名称为:Comparing average lo...
ipcpu 9年前 (2016-01-18) 10669浏览 0评论
零、回顾 上节我们使用openfalcon实现了类似cacti的出图功能,安装了 agent–>transfer–>graph–>query–>dashboard等组件,这次我们安装剩余的组件来实现nagios的报警功能。 ...