个人介绍
有着较强的学习能力,能尽快的适应新的环境
具备很强的 ownership,故障排查能力,有很好的技术敏感度和风险识别能力 有着比较强烈的学习欲望,具有较强责任心,对于事物有着敏锐的观察力,做事认真负责。 良好的服务意识,善于团队协作,项目管理,主动思考,自我驱动力强 良好的文档编写能力
工作经历
2021-12-05 -至今上海派拉软件有限公司高级运维开发工程师
Ø 制定和优化运维高可用的解决方案,包括智能调度/弹性扩容/分布式存储等 Ø 负责运维开发工作,建立和实施系统部署自动化的标准,实现项目持续集成,持续交付 Ø 建设线下虚拟化平台,使用VMware/OpenStack对资源进行利用最大化,并合理分类相关资源 Ø 规划并主导公司的业务体系向容器化转变,并通过底层Ceph存储,保障数据的可用性,通过 Prometheus 监控应用和节点,保证集群的健壮性,通过 ELK 平台,提供研发人员的便捷的同时, 一定程度上保护了主机的安全性 Ø 负责公司所有的分布式存储的部署/维护/接入,CEPH/MINIO/NFS Ø 负责各种SDK类型的开发,LDAP数据同步,云平台SDK接入,Deploy工具 Ø 负责公司 Spring Cloud 体系向 Service Mesh 体系的改造,维护统一的开发软件架构,发现和解 决存在的技术问题 Ø 参与 Gitlab Flow 规范的制定和实施,并根据实际情况实现 CI/CD 功能,包括但不限与 Gitlab- CI,Jenkins,Argocd 等 Ø 负责建立完整的监控/日志体系(Prometheus/A
2019-12-06 -2021-11-11中科迅联智慧网络科技有限司高级运维开发工程师
Ø 负责运维部日常管理工作,优化运维流程,降低各项系统风险 Ø 负责构建整体运维体系,基础架构设计,自动化的运维体系,降低运维成本 Ø 负责公司运维工具的开发,使用Python/Shell/Golang,包括但不限于云平台接入,CI/CD Ø 负责规划/设计并推动运维自动化的建设,提高运维效率 Ø 负责公司整体的监控系统的建设,通过Prometheus实现监控指标的收集,实现快速响应 Ø 负责云环境的建设,包括网络规划,网络基本安全测试,VPC边缘限制,子网规划,IPsec接入, VPN 实现 Ø 负责整个业务体系的数据备份,通过云产品,以及各种脚本实现数据及时备份 Ø 负责整个公司业务的前端集群的维护,优化,以及对应的安全策略的部署/更新 Ø 负责日志系统的部署/优化,通过ELK提取虚拟机/容器/K8S中的日志,实现对各个部门日志需求 的展示 Ø 负责改造CI/CD功能,按公司业务采用合适的CI/CD机制,通过Jenkins,Jenkinsfile实现持续 构建,持续部署 Ø 负责应用容器化,Kubernetes的规划/选型/维护,并使用Ceph存储,实现重要数据与K8S集 群剥离
2017-09-06 -2019-06-12信投资本高级运维工程师
Ø 生产环境、测试环境、开发环境主要包括 Nginx、Tomcat、Apache、PHP、Memcached, Java,Redis,Mysql、Jdk 等安装、调试和日常维护。 Ø 测试、生产系统版本发布,监控并处理线上环境的突发问题,根据运行状况及问题编写运维 报告。 Ø 利用 Jenkins+Shell+Gitlab 脚本实现系统自动化程序发布、性能监控、业务日志数据提炼分 析为相关部门提供相关运行数据 Ø 配合开发、测试团队解决工作中遇到的系统环境问题及环境需求 Ø 部署和维护 Nagios、Cacti、Zabbix 并监控各服务器节点的运行状况。 Ø 通过 KVM 虚拟化技术,进行 KVM 集群化统一管理,虚拟机大的规模部署与单点虚拟化的无缝迁 移,确保所有环境的稳定运行。模板化部署运维操作跳板机、备份服务器和监控服务器、通 过 linux 防火墙技术实现限制访问策略和安全控制 Ø 部署调试 LVS+keepalived 实现 nginx 高可用性,并通过 nginx 反响代理实现了 7 层负载 Ø 熟练掌握 GIT 代码管理服务器的应用与发布 Ø 熟练掌握 Windows
教育经历
2013-09-06 - 2017-06-10四川科技进修学院计算机科学与技术本科
技能
1.采集CI/CD执行的时间长度 2.采集CI各阶段执行时间长度 3.采集CI/CD执行的失败率 4.采集测试阶段的单元测试覆盖率,通过率 5.采集Merge request的合并时长
1. 监控系统采用Prometheus+grafana+influxdb实现公司环境和Kubernetes环境的指标监控 2.日志系统采用ELK的模式进行日志收集与分析