个人介绍
博客地址:https://blog.csdn.net/weixin_45413603
工作经历
2020-12-01 -2022-04-01哗啦啦sre
1.负责架构整理,以及接收一部分新项目的部署,以及旧项目的迁移。 2.工单值班以及监控轮值,以及新运维平台的推进跟进。 3.核心业务线链路梳理以及保障核心业务线的稳定性。 4.公司网关链路优化以及K8S版本升级。 5.测试以及生产环境Mesh进度推进。 6.负责公司CMDB以及Agent的服务开发。
2018-04-01 -2020-11-01细刻高级运维开发
1.负责AWS资源的管理,以及站点的日常维护。 2.参与公司自动化运维平台建设与开发。 3.对公司监控、报警系统优化。 4.日常的运维支持。
教育经历
2014-09-01 - 2017-07-01山西能源学院机电专科
在上学期间,多次参与学校计算机相关比赛,憝新的技术充满了热情
技能
公司整体服务器是云上云下混合云,对于现有IDC机房需要做资产统计,例如统计服务器以及内存条还有CPU的金额以及数量还有损坏程度。 1.采用Go语言来开发整体的后端Api接口。 2. 跟前端以及网络同事确认需求并且完成开发工作。 3.根公司现有资产管理中心做数据对接,保持数据一致性。
公司内部集群版本不统一,部署环境杂乱,各种混合部署以及服务器规格不统一,造成对接K8S服务需要处理K8S Api版本不统一问题并且在运维过程中因为版本不统一出现很多问题。以及推进K8S版本一方面也为了后续落地Mesh,解决灰度发布以及很多熔断限流等问题。 1.因为部分集群版本过于落后 1.7 1.8 目标版本为1.20 ,则重新搭建迁移服务。 2.在集群搭建过程中准备好Ansible,所有集群搭建标准化。 3. 部分可以升级的集群例如1.14 升级1.20 需要规避一些已知问题,例如traefik ingress版本问题以及升级服务配置文件问题 4. 集群升级完毕之后,推进Mesh在环境中的落地,目前测试环境已经覆盖百分之80.
1.熟练掌握Linux操作系统命令和Shell脚本,可以独立完成系统维护管理。 2.熟悉NoSql和MySql的运维管理。 3.熟悉Prometheus以及针对Prometheus自定义开发Exporter以及Webhook对接钉钉。 4.熟悉Ansible自动化运维工具,使用Jenkins和Gitlab构建自动化运维体系。 5.熟练掌握Docker容器引擎的基本操作以及使用Dockerfile制作镜像。 6.熟练掌握K8S容器云平台的运维管理,阅读过K8S部分源代码,具备较强的排错能力。 7.熟悉Go语言以及Beego以及Gin框架,参与公司运维平台开发。 8.熟悉Operator-sdk、Kubebuilder等脚手架,可以基于脚手架开发自己的Operator。