wolf27w
1月前来过
全职 · 800/日  ·  17400/月
工作时间: 工作日8:00-20:00、周末8:00-20:00工作地点: 远程
服务企业: 2家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

十年经验老运维,有kubernetes近五六年的工作经验,不管是升级还是优化。针对linux的多个版本有丰富的经验,对于100台以下的服务器维护可以考虑长期合作。应用运维,不管是传统的tomcat还是微服务都有丰富的经验,nginx的高可用,灰度,业务结构图,监控等等。存储运维,主要针对mysql的优化,数据迁移,数据备份等

工作经历

  • 2021-06-03 -至今可及零售运维负责人

    1、 运维结构规划,资源优化,成本节约 2、 服务迁移规划,并实施服务迁移至阿里云,开发ack的pod有状态和无状态以及自动发布,ingress跨域,以及ingress的优化。 3、 Redis,mysql,消息对列mq,云原生多模数据库Lindorm,云数据库ClickHouse等存储集群维护。 4、 利用ceph作为存储集群,分配有状态的服务作为数据持久化。 5、 利用rancher,kubesphere管理多集群,以及日志实时输出和监控以及hpa的自动伸缩和cronhpa的定时伸缩。 6、 Devops自动流出推广,利用gitlab中的webhook触发jenkins的job构建镜像,使用ansible的playbook生成pod的yaml文件进行部署。 7、 运维相关基础服务ldap,git,jumpserver,confluence,yapi,yearning,pinpoint,prometheus,grafana,nexus,kubesphere等等。 8、 独立实施服务上kubernetes,利用service负载,rollingUpdate做迭代更新,在kubernet

  • 2019-11-02 -2021-11-06托普朗宁sre运维

    1、 Kubernetes公司内部推广,以及参与架构设计,利用阿里云的vpc组建内网,构建kubernetes集群,通过ingress实现内外网分离保证数据安全性。 2、 Kubernetes实施,负责监控、日志收集。监控利用Prometheus+grafana进行展示,Alertmanager负责报警,监控内容包含应用状态,应用资源,阿里云底层的基础监控等。日志收集采用filebeat+kafka+logstash+es+kibana的方式进行采集。 3、 内部培训Kubernetes的使用,日志查看,监控查看,链路追踪查看等服务的使用。 4、 利用DevOps理念,推广自动化发布更新,自动测试等等。 5、 利用Pinpoint监控后台程序,Prometheus+grafana日志以及服务运行状况以及报警。 6、 利用Kubernetes整合所有服务资源,通过Kubernetes容器构建CI/CD的DevOps的流程,拉取github的代码使用sonarQube进行代码审核通过进行jenkins编译,编译后build一个镜像发送到harbor中,调用Kubernetes的镜像更新接口

  • 2016-11-04 -2019-11-02四达时代运维负责人

    1、参与kubernetes的调研,并内部分享kubernets以及功能的实现。 2、kubernetes测试环境,测试服务上线流程,以及迁移演练,监控分析,以及监控指标等等 3、主导openstack迁移kubernetes,并利用kubernetes的标签对服务结构进行分类,参与从服务重新构建到kubernetes测试,压测分流,上线等流程。以及后期的日志采集,监控报警以及二次开发等。 4、利用DevOPS概念推广ci/cd自动化,版本更新迭代,灰度发布等。 5、人才培养,考核激励团队管理建设 6、建立运维团队管理方案,持续提升运维效率

  • 2009-08-01 -2014-11-01乐游科技运维工程师

    1、中东、日本雷霆战机项目的维护,基于java的tomcat利用nginx的tcp做负载均衡,利用redislive监控redis,mysql做脚本增量备份,日志分隔。系统监控用nagios,保障服务器的正常运行。游戏更新:利用文件对比MD5然后用ansible进行文件分发,保证服务器在最短时间内完成游戏的更新。 2、利用docker+git进行代码存储,用jenkins+tomcat+ant+java+linux进行代码审核,用cachecloud做redis云。利用python开发基于Django框架的代码更新程序。 3、腾讯游戏更新自动化部署,利用简单的前端页面提交版本号,用django框架在服务器内查找资源包进行压缩提交,然后腾讯安全部门进行检测。然后进行文件分发更新到正式环境。 4、ruby的基础学习,利用ruby进行日本和中东区域服务器的基本维护

教育经历

  • 2005-08-01 - 2009-07-01武汉科技大学计算机应用技术本科

技能

服务器运维
负载均衡
自动化运维
K8S
jenkins
0
1
2
3
4
5
0
1
2
3
4
5
作品
prometheus+grafana

1、针对kubernetes的集群环境master节点和node节点的监控 2、针对java微服务的JVM的监控 3、针对ingress的监控 4、针对pod节点的CPU和内存以及网络的监控

0
2023-04-12 10:28
elk日志监控

1、利用filebate*kubernetes中node节点上的容器日志信息 2、filebate把日志发送给kafka集群 3、kafka集群把日志转发给logstas,在logstas中进行日志过滤。 4、logstas把日志过滤后写入到ES中 5、kibanat获取日志内容进行展示

0
2023-04-12 10:29
电商业务结构

项目介绍: 1、整个业务都是部署在阿里云环境上的,使用自建kubernets,利用阿里云的slb做工作负载。 2、避免夸命名空间的问题,这里使用了两个ingress,分别利用两个slb做内外网隔离。 3、pod利用探针检查服务,根据探针的监听状态,保证服务的可用性。 4、利用跳板机,针对阿里云环境中的服务和公司做隔离,公有云服务对外不提供直接访问服务。 5、prometheus进行监控,针对服务的状态,以及ingress的监控

0
2023-04-12 10:30
更新于: 2022-11-07 浏览: 189