欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

001.常见监控简介

程序员文章站 2022-03-24 12:43:48
一 监控架构 1.1 组成 客户端:数据采集部分 服务端:数据存储分析告警展示 1.2 采集模式 被动模式:服务器端到客户端采集数据,对服务器的开销较大,适合小规模的监控环境。 主动模式:客户端主动上报数据到服务器端,对服务器的开销较小,适合大规模的监控环境。 1.4 协议 专用客户端采集 公用协议 ......

一 监控架构

1.1 组成

客户端:数据采集部分
服务端:数据存储分析告警展示

1.2 采集模式

被动模式:服务器端到客户端采集数据,对服务器的开销较大,适合小规模的监控环境。
主动模式:客户端主动上报数据到服务器端,对服务器的开销较小,适合大规模的监控环境。

1.4 协议

专用客户端采集
公用协议采集:snmp/ssh/telnet

1.5 架构

c/s架构:被监控节点较少,产生的数据较少。
c/p/s架构:被监控节点较多,监控类型复杂,产生的数据和网络连接开销很大,跨地域等环境下。

二 常见监控软件

流量监控:mtrg、cacti、smokeping、graphite等
性能告警:nagios、zabbix、zenoss、core、ganglia、opentsdb等

三 常见监控内容

监控项目
描述
主机监控
cpu、内存、磁盘的剩余空间/利用率和i/o、swap使用率、系统up时间、进程数、负载
网卡监控
ping的往返时间及包成功率、网卡流量,包括流入/流出量和错误的数据包数
文件监控
监控文件大小、hash值,匹配查询、字符串存在与否
url监控
监测制定url访问过程中的返回码、下载时间及文件大小,支持内容匹配
应用程序
端口和内存使用率、cpu使用率、服务状态、请求数、并发连接数、
消息队列的字节数、client事务处理数、service状态等
数据库
指定的表空间、游标数、session数、事务数、死锁数、缓冲池命中率、库cache命中率、
当前连接数、进程的内存利用率等性能参数
日志
错误日志匹配,特定字符串匹配
硬件
温度、风扇转速、电压等

四 其他需求

4.1 时间需求

监控系统应根据实际情况,实时/非实时的采集和展示数据,包括历史趋势数据展示、分析,容量报表、可用性报告等。

4.2 告警需求

支持多种方式,邮件、短信、im和其他接口,具有可定制化功能。
只是对告警内容分析自动处理,防止误报、漏报、抖动等。