

个人介绍
⎔ 云服务:阿里云/腾讯云混合云架构优化 | AWS EC2+S3实战经验;阿里云/腾讯云/AWS 疑难杂症处理
⎔ 监控体系:Prometheus+Grafana深度调优 | 夜莺二次开发 | 自定义指标设计(如业务KPI映射)
⎔ CI/CD:Jenkins Pipeline设计 | 与GitLab集成实现分钟级发布
⎔ 日志治理:ELK日志告警联动 | Loki低成本日志留存方案(较ELK降低40%存储成本)
⎔ 开发能力:Shell脚本工具库(200+实用函数) | Python开发运维工具 | Go语言云平台api封装
工作经历
2022-04-01 -至今上海xx网络技术有限公司SRE
>维护开发/测试/生产环境100+套;包含自动化 CI/CD; >自动化运维:Jenkins+gitlab+CMDB+captain ;优化自动化流程 监控告警平台: 1.指标收集:阿里云云监控、各中间件 agent 、服务自身指标(Actuator等),自定义指标; 2.监控大盘及告警及告警:夜莺、Prometheus,Granfa,鹰眼汇总各类监控指标>业务问题快速定位:elk+skywalking +监控; >各类项目架构设计及技术支持;推行serverless(knative) >推行微服务集群化、容器化及其他特殊服务自动化部署; > cmdb规划,及数据模型制定,数据处理和维护, >运维工作流程的优化及标准制定,提升运维工作效率。
教育经历
和TA聊聊APP扫码和程序员直接沟通

该用户选择隐藏教育经历信息,如需查看详细信息,可点击右上角“和TA聊一聊”查看
技能

系统环境:Linux、K8s、Go、Python、MongoDB/Redis/Zookeeper 项目简介: 基于开源项目蓝鲸(bk-cmdb》,在此之上进行二开,定位为本公司资源整合、数据关联平台。 职责描述: 需求分析与架构设计: 与各业务部门沟通,深度挖掘系统需求; 主导自动化、非自动化数据采集方案的落地及实现,封装API,封装原PythonSDK,自定义更多模块,支持所有模型的自动化录入,提高开发效率;实现监控系统、服务器等资源的数据同步,确保CMDB数据的实时性和准确性; 建立CMDB使用规范和运维流程,确保系统的稳定性和可维护性; 与业务团队保持持续沟通,根据业务需求变化进行系统功能的扩展和优化。
