




个人介绍
1. 精通Linux系统架构,擅长使用CentOS/Ubuntu构建高可用性集群,通过编写Shell/Python脚本实现服务器批量部署效率显著提升,优化系统性能至单节点QPS峰值15万+,确保系统稳定性高达99.99%。
2. 专业从事云原生应用开发,熟练运用Go-gin与Python-Flask技术栈,开发20余款运维管理系统,包括监控告警、CI/CD流程与日志分析,确保接口响应时间保持在50ms以内,通过容器化平台建设,有效提升资源利用率达55%。
3. 成功构建智能监控体系,整合Zabbix、Prometheus及Grafana等工具,实现对600+节点网络的全面监控,并通过ELK实现PB级日志的实时分析,确立200+关键业务监控指标,显著提升故障定位效率至原先的90%。
4. 致力于DevOps流程优化,设计并实施基于Jenkins、GitLab及Ansible的自动化流水线,大幅提升版本发布效率,并实现误操作率的彻底消除。
5. 精于多云架构规划与实施,在AWS、阿里云及腾讯云等平台成功部署混合云解决方案,利用Terraform实现基础设施即代码(IaC)管理,有效降低年云成本42%,并构建跨云备份方案,确保RTO<15分钟,RPO<5分钟,有效抵御600Gbps规模的DDoS攻击。
工作经历
2021-03-01 -2025-03-01安全公司高级运维工程师
1. 运维200+节点混合云集群(自建机房+云),设计自动化巡检脚本(Shell/Python),系统全年可用性达 99.98% 2. 搭建Docker编译环境,支持多个项目并行构建,镜像生成效率提升 70% 3. 基于GitLab+Jenkins构建CI/CD流水线,实现日均 10+次自动化发布,环境构建耗时从30分钟缩短至5分钟 4. 开发跨平台部署工具(Shell/Python),支持多平台环境一键部署,项目上线周期缩短 65% 5. 使用Go重构Prometheus Exporter,实现 500+ 监控指标自定义采集,告警准确率提升至 95% 6. 设计飞书/Jira双通道告警系统,平均故障响应时间(MTTR)从 20分缩短至3分钟 7. 开发Python-Flask中间件集成Jira/飞书API,自动化同步 3000+ 任务状态,团队协作效率提升 40%
教育经历
2017-03-01 - 2021-06-30四川大学计算机科学与技术本科