个人介绍
1. 熟练掌握Linux操作系统的安装及性能调优
2. 熟练掌握Jenkins持续集成,使用Jenkins自动化部署各个服务应用
3. 熟练掌握部署Java、Springboot、SpringCloud微服务项目
4. 熟悉Prometheus监控工具,能够对系统资源,IO设备,磁盘设备及服务进行自定义监控
5. 熟悉MySQL、Postgresql数据库安装、配置能够搭建MySQL、Postgresql数据库主从复制、读写分离
6. 熟悉各类中间件(Apache、nginx、web、mq)等部署及调优
7. 熟悉Docker、Kubernetes、Rancher、Kubesphere
8. 认同Devops文化,通过Devops提高工作效率
工作经历
2022-03-20 -至今北京小懂科技有限公司运维工程师
1.腾讯云平台服务器维护,备份,监控,续费,服务器扩缩容等 2.负责维护TKE集群,TKE集群维护,集群迁移,扩容缩容,项目应用更新,架构调整,保证服务能够正常运行 3.代码发布,通过jenskin完成持续集成交付,测试和预发布测试无问题后再发布到生产环境 4.通过prometheus实时监测主从节点容器状态,cpu,内存,负载,出现问题及时通过预设报警机制发送邮件报警,及时处 理问题,保证公司线上业务7x24小时正常运行 5.系统或应用故障处理后梳理运维文档记录并统一汇总整理到wiki,提供给自己备忘以及后续相关人员处理业务问题时进行 参考 6.业务线项目成本管控,每月搜集上月使用的成本情况,结合公司业务情况和研发对接采取将配或下线的方式降低公司成本 7.公司运维工具需求图收集整理,配合开发进行项目验收
教育经历
2015-11-09 - 2019-06-30华中师范大学工商企业管理本科
技能
1.使用prometheus配合grafana丰富的页面展示进行监控 2.Agent端:以Daemonset控制器部署node-exporter,收集nodes节点数据 3. Server端: Prometheus服务端,从node-exporter拉取数据,存储到时序数据库,设置pv进行持久化存储 4. Kube-state-metrics,将prometheus中可以用promql到的数据转为k8s对应数据 5.Grafana Deployment控制器部署,pv 数据持久化,通过service设置 nodeport直接对外提供服务,设置grafana db数据 为prometheus监控服务的Pod配置nodeselector在指定节点上进行部署,跟生产环境进行区分 6.主要监控信息:集群状态,节点状态,控制器资源使用情况,Pod的运行状态等 业绩: Kubernetes集群监控和Pod容器监控实现,一旦出事故进行钉钉报警
1.安装Elasticsearch,使用StatefulSet创建, 当数据输入成功es会进行分片和副本 2.DasemonSet 部署fluentd,确保每个节点运行一个进行日志收集,为进一步控制资源,会为daemonset指定一个选择标 签,fluentd=true来做进一步过滤,只有带有此标签的节点才会部署fluentd 3. fluentd进行日志采集,需要配置采集哪些目录下的日志,采集后发送到es端,因此需要配置的内容比较多,选择使用con figmap的方式把配置文件整个挂载出来 4. Kibana获取Elasticsearch中的数据进行可视化展示,通过ingress对外提供服务,方便相关技术人员对日志进行查询查看 业绩: kubernetes node节点和Pod进行日志记录,防止容器崩溃、node宕机,日志丢失,方便问题定位查看处理