个人介绍
工作经历
2018-10-01 -至今京东运维架构师
业务运维保障 安全业务稳定运行:保障10+核心安全业务系统稳定运行,对接5个安全团队、200+研发人员,SLA全年99.98%以上; 连续5年无P3级以上事故、线上问题量逐年递减。 Devops和AIOps一体化运维工具平台:引入Devops与AIOps提高运维质量,建设运维工具平台(SIOP Project)。实现CICD发布一体化(多类原子操作)、多的监控、大促看板一体化;后入AIOps等机器学习算法,事件异常检测、故障根因定位、自动处置、预案与事故平台化、本地运维知识库。 K8s与云原生项目:更新基础设施到K8s,协同业务云原生改造,业务鲁棒性显著增强。CICD适配能力更新,监控项目落地K8s,可监控指标量从20w扩容60w,存储容量无缝扩展。 安全体系建设并协同零售落地:应用自身运维专业能力,助力安全业务快速打通业务侧关键节点,参与推动流量网关WAF落地、反爬验签网关研发与零售业务侧落地、数据安全零信任产品落地、DLP等数据合规产品落地。 应急预案与混沌演练:从业务基础设施、架构、业务交付三个维度提取异常场景,针对业务特点指定方案及处置动作序列,确保预案有效性,异常发生自动
2007-10-01 -2018-08-01IBM,百度,用友,腾讯运维工程师
用友网络 运维负责人 2015.9 - 2018.10 负责业务稳定性保障。 运维平台建设、成本管理。 艺龙网信息技术北京有限公司 运维架构师 2012.7 - 2015.7 设计异地双中心技术架构并落地。 建设监控体系,重构业务监控项目。 组建大数据运维小组。 百度在线网络技术有限公司 运维工程师 2010.6 - 2012.1 搜索业务运维、大数据运维; 运维工具平台研发。 IBM(中国)有限公司 系统工程师 2007.9 - 2010.4 500+在线计算集群运维。包括 上线发布,计算集群稳定性,一级、二级存储备份集群维护。 虚拟化vsphere集群运维。
教育经历
2022-01-01 - 2024-01-01北京科技大学计算机科学与技术初中及以下
河北地质大学本科 计算机科学与技术 北京科技大学研究生 MBA
技能
一体化 DevOps 运维平台具备 CI/CD、性能监控等功能,含代码托管等组件,提效保质、业务稳定性。主要功能: 1. 持续集成与持续部署(CI/CD),实现自动化的代码构建、测试和部署。 2. 应用性能监控,实时跟踪应用的可用性和性能指标。 3. 资源管理,有效分配和管理计算、存储等资源。 4. 日志分析,快速检索和分析系统产生的日志。
业务可用性监控,故障快速发现定位。保障业务的稳定运行。对业务可用性的监控,实时掌握业务状态。采用先进的监控技术和工具,设定关键指标阈值,实现故障的快速发现。当故障发生时,借助精准的定位系统,迅速确定故障源头。建立完善的告警机制,及时通知相关人员处理。持续优化监控策略,适配业务变化。
对业务流程全面、实时监控,保障系统稳定运行。功能包括:实时监测各环节的性能指标,如响应时间、流量等;快速定位故障点,缩短故障排查时间;对资源使用情况进行分析,实现资源的合理调配;提供可视化的监控界面,直观展示链路状态;提前预警潜在风险,便于及时采取措施;生成详细的监控报告,为优化决策提供数据支持。