kodakumi
1月前来过
全职 · 1500/日  ·  32625/月
工作时间: 工作日10:00-17:00工作地点: 广州远程
服务企业: 10家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

本⼈有10年以上的集成和运维经验,4~5年的管理经验,能熟练调试、安装等各种⽹络以及硬件设备,独立判断和解决问题,能使⽤⽹络管理⼯具进⾏复杂⽹络的规划、管理和故障排错;

精通Linux能熟练安装、使⽤、配置、管理以及性能优化等主流版本型号(RedHat 、Centos、Ubuntu等)的操作系统,精于容量规划、架构设计;

在脚本语⾔⽅⾯,熟悉Python/Shell,Golang和Java编程语⾔,能进⾏脚本的编写,并利⽤Python语⾔参与开发过堡垒机、CMDB资产管理、监控等系统和⾃动化运维⼯具。

在数据库⽇常维护⽅⾯,能在linux下安装、配置、维护和优化各类型数据库,并进⾏性能监控和调优,数据备份/恢复计划的制定、执⾏,系统数据安全以及权限管理等,能利⽤数据库的主从复制、MHA、NDB-Cluster等技术⼿段实现⾼可⽤、可扩展架构,并提⾼业务⾼可⽤性和容灾能⼒.

在虚拟化、云和⼤数据⽅⾯,能熟练使⽤云计算软件(Vmware/RHEV/KVM/OpenStack/Docker), 并对⼤型云平台系统进⾏规划和集成,并能熟练的对OpenStack环境虚拟私有云

负载均衡进⾏维护,对云平台的linux和windows服务器的⽇常运维、监控、故障排查和资源池环境建设、测试;

利⽤Prometheus+Grafana、Zabbix等开源监控⼯具对云平台的业务、系统进⾏监控并配置告警,7*24⼩时接收报警信息并处理、优化以及⼆次开发等;

在⼤数据⽅⾯,利⽤CDH开源社区版本,并熟悉其Hadoop、kafka、ES、flflink、spark等开源组件以及服务,并能实现数据采集、计算等流程;

在容器⽅⾯,熟悉Docker、Kubernetes容器集群的安装、监控、故障处理、性能调优和整体⽅案落地;

熟悉公有云服务商:AWS/GCP/Azure/阿⾥云/腾讯云,并具有丰富的使⽤经验

在DevOps⽅⾯能搭建基础运维架构,构建IaaS基础设施平台层,⽤技术满⾜业务发展需求,能维护各项基础/应⽤服务,监控主机/服务运⾏状态,保障业务稳定运⾏,保障基础设施平稳运⾏,并制定和优化运维解决⽅案,例如容灾、防攻击、扩容、备份等和全⽅位的性能优化,推动及设计和开发⾼效的⾃动化运维平台、管理⼯具,从⽽实现运维⾃动化和运维效率的提⾼

工作经历

  • 2021-12-31 -2023-01-20软通动力云原⽣架构师

    1、负责云原⽣容器PaaS平台的架构设计和功能研发; 2、负责研发云原⽣基础组件研发,包括⽹关、⽇志、监控、⽹络、容器调度、安全、存储、配置、容灾等; 3、负责业务系统的容器化、相关中间件的容器化并平稳迁移到容器平台; 4、负责k8s容器的混合云管理相关架构设计和实现; 5、负责云原⽣平台稳定性保证及未来的演进和迭代; 6、负责主流云⼚商的原⽣化化技术应⽤和研究; 7、负责公司DevOps流程研发

  • 2019-11-12 -2021-12-31暗物智能⾼级系统架构师

    1、负责公司IDC整体架构的规划、设计、实施以及后期的维护等,20个机柜,200台左右的服务器,2个虚拟化集群(100台左右的虚机),20台⽹络设备(包括了防火墙、负载均 衡等) 2、利⽤CDH开源社区版本搭建⼤数据平台(数据量⼤概在100T左右),并使⽤其开源产品的技术原理,如:Hadoop、kafka、ES、flflink、spark等来实现数据采集--计算处理--输 出与展⽰的阶段流程 3、负责公司运维平台的规划、开发与建设,并建立规范、⾼效、⾃动化的运维体系,保障系统性能、可⽤性与稳定性,降低运维成本; 4、负责带领团队开发、利⽤promuthus+grafana、zabbix等监控⼯具,并进⾏⼆次开发以及编排配置等来完善系统监控告警、利⽤SaltStack、Ansible、Jenkins等⾃动部署以及内 部的⾃动化⼯具来辅助系统; 5、负责运维架构的持续迭代演进,提供稳定、安全、⾼性能的系统环境; 6、负责Docker、Kubernetes容器集群的安装、监控、故障处理、性能调优和整体⽅案落地,现有容器数量在100+左右,并承载了公司多个项⽬以及应⽤⼤约在10

  • 2018-03-06 -2019-12-31有米科技运维总监

    1、主要负责有米运维开发团队的管理,运维体系、架构、规范与流程的制定和设计; 2、平台化与⾃动化运维的推⾏、落实与实施; 3、⾃动化运维平台的整体架构的设计、核⼼功能模块的设计与开发; 4、容器化与微服务的推⾏,负责利⽤Docker + kubernetes群集搭建虚拟化以及公有云平台,实现该平台的⾼可⽤以及稳定运⾏,现有容器数量在300+左右,并承载了公司多个项 ⽬以及应⽤⼤约在500+左右,利⽤Python+docker-fifile对其进⾏⼆次开发; 5、新技术的研究并运⽤到实际⽣产业务当中,提⾼其效率; 6、负责阿⾥云(100+实例、RDS)、AWS(国内和海外700+实例,DDB、S3、Redshift、EMR等)、UCloud(20+实例)等公有云和私有云运维、搭建以及迁移;

教育经历

  • 2022-09-24 - 新加坡国立大学计算机科学与技术博士

    电脑工程与科学博士在读,主攻人工智能以及云计算方向

  • 2010-09-01 - 2013-07-08中山大学计算机科学与技术硕士

技能

系统架构
自动化运维
K8S
0
1
2
3
4
5
0
1
2
3
4
5
作品
Kubernetes&Istio管理平台

Kubernetes资源管理 Istio资源管理 配置管理(支持多版本回滚) 流量治理 灰度发布(支持回滚) 直接发布 流量权重发布 金丝雀发布 熔断&限流设置 故障注入设置 流量监控(暂未实现) Istio基本配置 系统用户管理

0
2023-04-07 20:44
SST 运维平台

基于GO语言和Saltstack开发的WEB运维平台 GO语言开发,无部署运行,OS版本: CentOS 7+ x86_64; 基于Saltstack,需要安装salt相关组件。 两种模式(ssh与salt)均支持并发执行远程命令

0
2023-04-07 20:45
Athena自动化运维平台开发

功能1: 清爽的运维导航界面,让收藏夹彻底下岗。 功能2: 你还在手工录入资产信息?快用Athena全自动化的CMDB模块,agent定时自动上报主 机硬件信息,基于salt-minion改写的,既能通过调用salt-api来达到salt-minion自动上 报主机信息,也能通过调用自研的agent来进行信息的自动变更,省时省力。 功能3: 分布式异步任务调度中心,分布式的,异步的crontab,没错,让crontab去再见吧。 任务周期随意定义,任务结果一目了然,任务还能设置过期时间。 功能4: ansible WEB界面,自动从CMDB调用主机信息,再也不用手工维护ansible hosts文件 啦,playbook role界面安装,还可以直接执行命令。 功能5: 自动发现的智能监控有木有? agent上报信息后自动关联监控,无需任何手工配置。 无需再用SNMP 功能6: 基于URL的权限管理,权限可以细化到每个页面。 功能7: Web ssh 功能上线啦,跟xshell say byebye。 最后,Athena基于DevOps理念开发,以整合全部运维场景为己任。Athena是一个真正 的基于运维思维而开发的全自动化运维平台.根据新一代的运维平台和CMDB的核心准 则: 一个资源能够提供服务,还要看它关联的资源,因此必须采用立体化模型方案 ,建立以Iaas--Paas-Saas为对象的新一代运维平台

0
2023-04-07 20:46
更新于: 2022-12-24 浏览: 530