作者:石文
时间:2019-01-07
错误
基础监控
机器级别:
- 宕机 pingmon
- 磁盘故障 mon_write_disk
- 网络丢包 packet_loss_rate
应用级别: - 进程宕掉 glusterd_process_monit
- 端口挂掉 port_monitor
业务监控
集群级别:
- 集群在线实例数 cluster_instance_moni
- 错误日志 log_error_moni
卷级别:
- 卷brick数量 volume_brick_moni
- 请求异常处理的数量 尚未有方案
- 上游依赖服务 无
延迟
基础监控
机器级别:
- IO等待 io_wait_monit
- 网络延迟 net_delay_monit
应用级别: - 无
业务监控
集群级别:
- 慢查询
- 缓存命中率
- 集群数据同步延迟
- 集群数据均衡度
卷级别:
- 卷数据均衡度
流量
基础监控
机器级别:
- 磁盘IO
- 网卡IO
应用级别:
业务监控
集群级别:
- 集群网络进出流量
卷级别:
- 卷数据增量
- 卷数据读量
- 接口访问量
饱和度
基础监控
机器级别:
- CPU使用率 cpu_use_monit
- MEM可用容量百分数 mem_usable_percent
- 磁盘可用空间 disk_free
- 网络利用率
- 文件句柄数
应用级别:
业务监控
集群级别:
- 消息队列长度
卷级别:
- 卷磁盘可用空间 volume_usable_space
- 卷正在进行的任务数 volume_task_monit
- 卷客户端连接数 gluster_nfs_brick_client_count(只采集,未设置告警)