个人介绍
我叫乔德立,十多年运维经验,热爱技术,持续学习,技术栈由最初的传统应用服务器中间件运维,到现在专注于DevOps自动化运维平台的构建和管理,中间也有一段专职流程管理的经历。
主要技术栈如下:
DevOps
多年DevOps和运维自动化经验,熟悉持续集成、持续部署相关流程和最佳实践工具链开发定制,包括Gitlab、Jenkins,配置管理工具Chef、Ansible。通过工具链可以实现传统运维的代码化和自动化,提升运维服务整体交付效率和质量脚本开发,使用Shell完成服务器配置,Python、Ruby实现Ansible、Chef的模块定制ITIL服务交付管理和项目管理
熟悉ITIL框架和服务交付相关流程,有一年全职担任变更经理经验,熟悉Operations大部分流程2017年获得ITIL® Foundation Certificate in IT Service Management认证有项目管理基础知识,作为应用中间件专家为项目进行预算和进度规划,也曾获得Project Management Professional认证有两年小型国际团队管理经验云技术
Kubernetes集群管理(获得Certified Kubernetes Administrator认证)AWS架构管理规划(获得AWS Certified Solutions Architect - Associate认证)阿里云云计算集群规划管理(获得阿里云云计算认证)微软云集群规划管理(获得Microsoft Azure Administrator Associate认证)应用服务器中间件运维
应用服务器运维经验,主要维护产品为IBM WebSphere Application Server系列维护和管理JavaEE性能熟悉Linux系统使用和运维(获得RHCE认证)工作经历
2018-09-01 -至今IBMDevOps团队技术Leader
维护和优化SDE环境(Software Defined Environment),帮助客户把传统运维项目转换至自动化运维。 我们的SRE工程师基于这套环境,通过持续集成和持续部署的最佳实践进行服务交付,通过代码自动化地完成客户应用的部署变更等运维任务。通过技术手段可以解决传统手工运维无法避免的人为失误、规模化部署带来的大工作量、回滚困难等问题。 具体工作内容: DevOps自动化运维相关工具链的管理和维护,包括Chef服务器、Gitlab、Jenkins服务器、Ansible Tower和UCD服务器的维护。工作内容包括:日常监控检测,常规升级,问题修复,高可用方案的维护等,确保整套工具链的稳定运行。 基于工具链,对工具链本身进行自我更新和运维。上述提到的所有任务,均通过持续集成的最佳实践来编写代码(包括但不限于:基于特性分支的开发,测试驱动开发(TDD),代码语法语义和格式自动检测,代码审核),同时自动化地完成测试和发布过程,并且采用可控方式实现快速安全部署,快速回滚。 使用Ansible和Chef开发基础库,为SRE提供技术支持。这里举例:我们维护很多基础库,比如hap
教育经历
2008-09-01 - 2012-07-31天津工业大学软件工程本科
成绩top5% 拿过两次国家励志奖学金 在校期间帮学校开发招聘网站
技能
作为WebHosting团队队长,提前发现和管理客户IT环境的问题,确保服务平台稳定运行,同时提升团队的服务质量。具体工作内容包括: 参加管理会议(Operation meeting,account meeting,CRQ meeting,SLA meeting,等等),与管理团队保持密切联系,进行必要的汇报和沟通 根据团队任务合理规划和管理团队资源 对既往发生的事故进行分析,预测其他可能发生的事故,以减少大型事故发生的概率 作为SME参与项目管理工作,主要是协助PMO团队进行预算和进度的规划,对于复杂项目提供中间件相关的技术建议和风险预警。主要涉及数据中心迁移,网站分割,新系统的建立,灾备测试等方面的项目 根据客户需求,为客户提供咨询服务 跟客户建立良好的关系。团队服务的客户在亚洲区多个国家,包括香港,马来西亚,泰国,中国,菲律宾和新加坡等,遵循诚实、透明、专业的原则,为客户提供专业放心的服务
在Change & Service Request Management团队担任Change Manager,为客户诺和诺德和NNIT内部管理变更流程。工作内容包括: 确保RFC (Request For Change)记录的完整性,确认所有必要的信息已经填入,包括业务需求,风险评估,执行计划,回滚计划,目标日期,等等 针对GxP change,审批相关的113文档,确保文档信息的完整性。和QA一起确保文档的合规性和正确签署 跟踪所有的change,确保每个change不论从技术层面还是业务层面都被完整评估和审批(包括Service Owner,Architect,本司和客户的技术专家),让每个change都能规避不必要的风险 确保所有的Urgent change和fail change都有PIR (Post Implementation Result),跟踪PIR的质量 制作月度生产力报表
SDE(Software Defined Environment) 平台的搭建。我们使用Ansible + Gitlab + Vagrant等技术搭建了一套自动化运维体系,其中应用到了DevOps理念和技术,应用和服务的运维过程由原本的手工+脚本方式成功过渡到了“本地开发+自动画构建和测试+一键部署意见回滚”模式,无论是运维变更的效率还是质量都更上一层楼,使得整个团队的运维人员都能从重复运维过程中解放出来,去做更有价值的事情,比如性能调优,问题提前判断和预防等等。 本人在国内团队担任技术leader,负责方案探索,技术交流,任务分配,生产力掌控,上下级沟通交流,日常系统开发等任务。 项目中使用的技术: Gitlab —— 代码管理和代码审核平台,由我们团队自己搭建管理,自己负责HA方案 Gitlab-Runner —— 流水线工具,大部分流程被抽象出来放到单独的脚本内,针对不同项目定制开发不同的流水线 Ansible-Tower —— 部署工具,一键部署和一件回滚 Ansible + Python —— 配置管理工具,所有运维的项目都转成Ansible的配置项,通过Ansible自带的资源完成大部分工作,通过Python编写自定义的功能库 Vagrant —— 操作系统镜像管理,虚拟机服务器的启停 Git+Githooks —— 构建本地开发环境,通过多种不同功能的hook触发本地代码检查功能,最大程度的减少把低质量代码传到服务器上的可能性 (Chef+Jenkins —— 我们曾经使用过的配置管理工具,因为各种原因转向了Ansible + Gitlab Runner)