项目描述:
数字化运维中心,用来解决安装,部署,升级各种系统类型的机器(linux,windows,aix,arm ,容器化机器),以节省大批量部署时间成本。支持针对各类中间件服务的日志,指标等数据的采集,通过清洗,转换,发送,以达到数据存储,数据分析,监控告警等功能。
基础架构:
server 端负责向外部系统提供接口,主机管理,agent 管理,采集中心,系统管理等模块功能。
agent 端安装在客户主机上,负责接收任务,数据的采集,处理及发送,以及上报心跳给 server。
web 端负责前段页面的展示
基础流程:
上传 agent 采集器(python,go 实现)-设备的接入(普通安装,远程安装 linux,win 等多种设备)-系统管理(设置熔断保护以及相应主机配置)-采集中心(采集任务的创建,包括日志,指标,进行主机的下发采集)-然后采集到数据层进行相应数据转换,解析,消费到 kafka ,对接到其他数据平台(存储采集到的所有的指标以及日志数据),告警平台(熔断触发告警的告警信息),监控平台(从数据平台存储的表中将数据读取以可视化形式展示相应数据)等其他产品