sre
10天前在线
全职 · 500/日  ·  10875/月
工作时间: 工作日08:00-20:00、周末08:00-20:00工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

我拥有6年的互联网运维工作经验。在2018年至2020年期间,我在一家区块链公司担任系统运维岗位,而在2020年至今,在同花顺的AI基础服务部担任应用运维岗位。

我主要负责三块内容的运维工作,分别是问财结果页模块(包括前端问句解析、领域划分、结果页取数以及数据库管理)、公司爬虫系统以及企业征信管理系统的运维。

在日常工作中,我负责系统稳定性建设,包括业务监控、数据库高可用以及中间件监控;提供7*24小时的故障处理服务;负责应用版本的发布;对线上资源进行优化;以及配合产品开发团队进行业务链路的优化。

在个人技能方面,我熟悉nginx、mysql、redis等组件的高可用建设;擅长linux操作系统的优化和k8s环境中业务稳定性的维护;能够排查网络相关问题并处理基本的http请求故障;熟悉kafka、zookeeper、nacos等中间件的运维;对flink、hadoop全家桶(hdfs+namenode元数据+datanode数据块)、presto等分布式数据库组件有丰富的维护经验;能使用shell和python编写日常运维脚本;熟练使用prometheus+grafana,ELK日志监控工具,对线上业务进行检测和问题排查。

工作经历

  • 2020-05-18 -2024-06-17浙江核新同花顺网络信息技术股份有限公司高级运维工程师已认证

    1. 负责事业部三条业务线的sre工作,包括故障处理、监控完善、CI/CD 、全链路故障排查、监控工具的开发 2. 负责分布式存储的运维工作:flink、Hadoop、Postgres、Dolpin、neo4j、spark、presto等各类型数据库的维护和故障处理 3. 负责业务依赖的各类中间件的部署和维护:kafka、zookeeper、nacos、prometheus+grafana、nginx+lvs、apisix等 4. 熟悉常见jvm故障快速处理,能根据监控和日志分析定位链路或者组件问题;在公司自建云平台处理各类常见k8s故障,进行日志分析和后续优化 5. 根据线上业务运行情况,联系业务线开发进行架构升级和资源优化,保证业务7*24正常运行 6. 对业务进行异地容灾和负载均衡,保证业务保持多活,预防单点故障;Mysql+MHA、nginx+lvs 等负载均衡配置 7. 编写 shell、python 等语言的监控脚本,确保在业务故障期间的自愈、报警升级、故障转移,以及后续的告警复盘、优化建议 8. 基于 python+django 开源框架的运维工具平台开发 9. 进行线

  • 2018-03-14 -2020-05-15杭州复杂美科技运维工程师

    1、负责应用系统的安装、配置、日常巡检、维护、故障的应急响应和问题处理; 2、负责 Linux 操作系统安全分析、漏洞扫描、安全加固,根据漏扫结果结合公司业务需要 进行安全策略配置和优化,保证其稳定、高效运行; 3、编写系统维护文档,更新和完善运维流程文档; 4、完善内部监控报警、自动化部署与发布等系统,优化运维架构、提升运维工作的效率; 5、主机性能、容量管理,系统补丁管理,系统优化与稳定方面的测试

教育经历

  • 2014-09-10 - 2018-07-12杭州电子科技大学信息工程本科

技能

服务器运维
DNS
监控
0
1
2
3
4
5
0
1
2
3
4
5
作品
企洞察

1. 项目中使用keepalive+nginx实现负载均衡,配合hot-upsteam、ingress实现容器转发 2. grafana+Prometheus 对服务器、中间件、数据库进行监控和报警配置 3. 中间件:kafka、nacos、zookeeper;数据库 neo4j、mysql、redis-cluster 4. Mysql+MHA进行高可用,Redis-clutser集群

0
2024-06-24 07:52
更新于: 06-24 浏览: 10