个人介绍
我拥有6年的互联网运维工作经验。在2018年至2020年期间,我在一家区块链公司担任系统运维岗位,而在2020年至今,在同花顺的AI基础服务部担任应用运维岗位。
我主要负责三块内容的运维工作,分别是问财结果页模块(包括前端问句解析、领域划分、结果页取数以及数据库管理)、公司爬虫系统以及企业征信管理系统的运维。
在日常工作中,我负责系统稳定性建设,包括业务监控、数据库高可用以及中间件监控;提供7*24小时的故障处理服务;负责应用版本的发布;对线上资源进行优化;以及配合产品开发团队进行业务链路的优化。
在个人技能方面,我熟悉nginx、mysql、redis等组件的高可用建设;擅长linux操作系统的优化和k8s环境中业务稳定性的维护;能够排查网络相关问题并处理基本的http请求故障;熟悉kafka、zookeeper、nacos等中间件的运维;对flink、hadoop全家桶(hdfs+namenode元数据+datanode数据块)、presto等分布式数据库组件有丰富的维护经验;能使用shell和python编写日常运维脚本;熟练使用prometheus+grafana,ELK日志监控工具,对线上业务进行检测和问题排查。
工作经历
2020-05-18 -2024-06-17浙江核新同花顺网络信息技术股份有限公司高级运维工程师已认证
1. 负责事业部三条业务线的sre工作,包括故障处理、监控完善、CI/CD 、全链路故障排查、监控工具的开发 2. 负责分布式存储的运维工作:flink、Hadoop、Postgres、Dolpin、neo4j、spark、presto等各类型数据库的维护和故障处理 3. 负责业务依赖的各类中间件的部署和维护:kafka、zookeeper、nacos、prometheus+grafana、nginx+lvs、apisix等 4. 熟悉常见jvm故障快速处理,能根据监控和日志分析定位链路或者组件问题;在公司自建云平台处理各类常见k8s故障,进行日志分析和后续优化 5. 根据线上业务运行情况,联系业务线开发进行架构升级和资源优化,保证业务7*24正常运行 6. 对业务进行异地容灾和负载均衡,保证业务保持多活,预防单点故障;Mysql+MHA、nginx+lvs 等负载均衡配置 7. 编写 shell、python 等语言的监控脚本,确保在业务故障期间的自愈、报警升级、故障转移,以及后续的告警复盘、优化建议 8. 基于 python+django 开源框架的运维工具平台开发 9. 进行线
2018-03-14 -2020-05-15杭州复杂美科技运维工程师
1、负责应用系统的安装、配置、日常巡检、维护、故障的应急响应和问题处理; 2、负责 Linux 操作系统安全分析、漏洞扫描、安全加固,根据漏扫结果结合公司业务需要 进行安全策略配置和优化,保证其稳定、高效运行; 3、编写系统维护文档,更新和完善运维流程文档; 4、完善内部监控报警、自动化部署与发布等系统,优化运维架构、提升运维工作的效率; 5、主机性能、容量管理,系统补丁管理,系统优化与稳定方面的测试
教育经历
2014-09-10 - 2018-07-12杭州电子科技大学信息工程本科