etcd监控脚本

我要开发同款
proginn20165698432024年06月28日
142阅读
开发技术k8s、监控、自动化运维、dns、服务器运维
所属分类云计算

作品详情

获取主机 IP 地址:

使用 hostname -i 获取当前主机的 IP 地址,用于后续监控数据的获取。
监控 etcd 日志中的错误数量:

通过 grep 命令从 /var/log/messages 日志文件中查找与 etcd 相关的错误信息,并统计错误数量。
检查 etcd 集群的 put 和 get 操作状态:

使用 etcdctl 工具执行 put 和 get 操作,以确认 etcd 集群是否正常工作,并统计操作的执行结果。
获取并解析 etcd 的 Prometheus 指标:

使用 curl 命令从 etcd 的 /metrics 接口获取 Prometheus 格式的监控指标。
解析以下关键指标:
etcd_server_leader_changes_seen_total:主从变化次数
etcd_server_has_leader:主节点数
etcd_mvcc_db_total_size_in_bytes:etcd 存储使用空间,转换为 GB
process_resident_memory_bytes:etcd 使用的内存,转换为 GB
process_open_fds:etcd 的打开文件描述符数(连接数)
将所有获取的监控数据打印输出,包括日志错误数量、put 和 get 操作状态、etcd 存储使用空间、内存使用、主从变化次数、主节点数和连接数。
根据 curl 命令的执行结果,输出 etcd 的运行状态(正常为 0,异常为 1)。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论