个人介绍
1. 熟悉AWS及阿里等公有云环境的资源编排、架构设计,有丰富的公有云运维经历,拥有AWS的SAA认证证书,掌握使用terraform和boto3管理公有云资源
2. 熟悉主流Linux操作系统,例如Redhat/Centos等,熟练使用Linux命令,能排除日常的错误及性能调优、安全优化,拥有红帽的RHCE认证证书
3. 熟悉云上和开源k8s技术,熟悉网络管控、流量调度及存储相关技术流程及原理,实际设计过云上k8s集群架构和参与集群维护
4. 熟悉CICD流程及设计理念,可熟练掌握github+teamcity和其他自动化相关组件集成,如vault,consul,terraform,chef
5. 熟悉Shell及Python,可熟练完成格式化数据处理、繁琐ops工作脚本化和自定义业务监控告警
6. 熟悉windows相关服务,如ad、adfs、ldap等,参与设计维护了多种wendows server的应用场景
工作经历
2021-05-04 -至今医疗大数据Devops
1. 迁移美国的业务环境到中国的aws上 2. 完成配套cicd流程建设 3. 使用vault + aws + saml2aws 等开源工具完成用户端的权限管理工具(shell),可以实现aws权限管理、业务api权限管理、数据库权限管理 4. 使用datadog完成业务数据的整理及展示 5. 完成业务流程自定义监控(python + lambda)
教育经历
和TA聊聊APP扫码和程序员直接沟通
该用户选择隐藏教育经历信息,如需查看详细信息,可点击右上角“和TA聊一聊”查看
技能
项目背景:客户在AWS上有百台左右服务器由我维护,其主要业务是学校相关,如食堂刷卡交易、教学管理平台、OA系统等。维护期间参与了多次关键节点的变更优化。 项目内容: 1. 优化服务器资源账单费用:对机器集群分批次完成系统组件更新,以支持aws更新的机器类型,多次在夜间配合应用完成机型升级,降低了总资源花费且整个变更对业务无感知 2. 将自建的网络共享存储迁移到性能更佳的EFS中,总计约700G的小文件。提前依据业务特点设计了多种预案,最终仅停机一晚完成所有数据迁移,不影响第二天业务使用。 完成情况: 对客户的主体业务集群进行了多次重大变更,以零失误、零延期顺利完成多方面优化,获得客户表扬信。
项目背景:中国公司刚开始成立时,需要将美国的业务体系迁移到国内,使用的AWS云 主要职责: 1. 负责中国区基础设施的迁移和升级,涉及到AWS的网络,存储和计算环境,以及一些开源工具的版本升级 2. 负责修改美国已有的terraform代码,以实现一份tf代码可以支持中美两地的AWS云资源管理 3. 使用chef完成CICD工具agent的镜像创建 完成情况: 成功落地,中国区业务上线顺利
项目背景:公司有大量公有云账号,由多名运维人员负责维护,如何把这些账号权限做到按需分发、精确授权,是很重要的安全管控问题。 主要职责: 1. 调研各类云平台共有的saml认证协议与windows的ADFS集成方案,完成环境搭建 2. 设计云平台和AD内个人用户的权限设计、分组设计,并将两者结合完成权限与用户分组的映射 3. 登录平台上线后,继续上线MFA功能,增加二次身份验证机制 完成情况: 所有签约客户的云平台账号(包括AWS和阿里云)的同一托管,工程师使用个人的AD账户登录平台后,根据所属用户组获得对应账号的指定权限,顺利解决了多账号情况下避免权限溢出的问题。