个人介绍
运维监控
上线前:Zabbix 监控服务器硬件资源、带宽、端口;
上线后:Zabbix 可监控到服务级别的运行状况(支付接口、MySQL 慢查询); 实施步骤:
01. 获取相关服务 API 文档;
02. 通过 POST/GET 方法模拟用户请求;
03. 获取返回数据,截取相关状态字段;
04. 记录请求总耗时;
05. 形成 Zabbix 自定义的 Python 脚本;
06. zabbix 自定义模板配置,设置报警阀值,图形生成;
2019.9-2019.9 K8s微服务日志改造容器业务日志收集
1. 调研日志收集组件并装好相关组件,如Fluentd、kafka、logstash、Elastics earch、kibana
2. fluentd用daemonset的方式运行在集群的每台节点,定义好configmap配置文件,过滤相关日志并推送到kafka,logstash去消费kafka的信息写入到es
,建好mapping信息,用kibana做数据展示
工作经历
2017-06-08 -至今上海暗沙运维工程师
1、及时分析系统各方面存在的问题,提出应该增强的措施; 2、保证系统达到要求的线上标准,并保证线上稳定; 3、游戏服务器与客户端的维护、更新和升级,做好数据库冗灾准备; 4、系统各层面监控,实时撑握网络状况、网络排故。
2015-01-01 -2017-03-03广东国际商品交易中心运维工程师
1、 负责日常网络及各子系统管理维护。 2、负责设计并部署相关应用平台,并提出平台的实施、运行报告。 3、负责配合开发搭建测试平台,协助开发设计、推行、实施和持续改进。 4、 负责相关故障、疑难问题排查处理,编制汇总故障、问题,定期提交汇总 报告。 5、负责网络监控和应急反应
教育经历
2014-07-01 - 2017-07-12广东岭南职业技术学院计算机科学与技术大专
主修计算机科学与技术