个人介绍
虚拟化技术:具备VMware vSphere、KVM、Docker及容器编排工具Kubernetes(k8s)的部署、配置、管理能力,熟悉虚拟机资源分配、迁移、备份与恢复操作。自动化运维工具:精通Ansible进行批量自动化运维任务编写与执行,包括软件部署、配置管理、系统监控等。熟悉SaltStack、Puppet等配置管理工具。数据库管理:具备MySQL、PostgreSQL等关系型数据库的安装、配置、备份与恢复、性能调优经验,熟悉NoSQL数据库如MongoDB的基本管理。云计算平台:熟悉AWS、Azure、阿里云等公有云平台的资源管理、VPC配置、负载均衡、对象存储、CDN服务等操作。监控与日志管理:熟练使用Nagios、Zabbix、Prometheus等监控系统进行服务器状态监控、性能分析与报警设置;擅长使用ELK(Elasticsearch、Logstash、Kibana)或Graylog等日志管理系统进行日志收集、分析与故障排查。脚本编程:熟练使用Shel编写各类运维脚本,实现自动化运维任务。具备一定的Bash、Perl、Ruby等脚本语言基础。
工作经历
2021-12-02 -至今上海新炬高级运维工程师已认证
独立负责一个项目,维护一百多台ELK机器,接入上万台机器日志,擅长环境搭建、产品维护、工单处理、es优化、和甲方对接、主要维护产品运行稳定和优化 协助运维团队进行服务器硬件故障排查、系统更新、服务配置等工作。 参与公司内部Docker环境搭建与维护,编写Dockerfile制作业务镜像。 使用ELK stack搭建日志分析平台,提供实时日志查询与可视化功能。 学习并实践Linux系统安全加固措施,如SSO、sudo权限控制、审计等。
2019-10-17 -2021-11-04宇信科技有限公司运维工程师
系统版本上线 网站发布 日志提取 例行巡检 搭建环境 iass sass客户服务 权限管理 svn开通维护 分析生产系统硬件资源是否满足当前业务系统的需要,及时发现性能瓶颈并调整 承担应用系统的网络,负载,应用健康状态监控 内存 cpu 磁盘 监控 备份 同步 挂载管理 ITSM服务流程 保障系统稳定
2016-08-12 -2018-08-04北京捷越联合运维工程师
负责监控、安全保障、工单处理、变更、主要用到zabbix、linux、定时任务、批量处理ansible 精通Linux系统管理,具有丰富的实战经验和扎实的理论基础。 熟练运用各种自动化运维工具和云计算平台,提升运维效率与服务质量。 具备良好的问题分析与解决能力,能够在压力下迅速定位并处理系统故障。 乐于学习新技术,关注行业动态,持续提升自身技术水平与业务理解能力。
教育经历
2012-09-01 - 2015-06-20河北科技师范学院机械制造及其自动化专科
学习使我快乐,工作使我快乐 能分析生产系统硬件资源是否满足当前业务系统的需要,及时发现性能瓶颈并调整 承担应用系统的网络,负载,应用健康状态监控 Python学习中...目标办公自动化 网络服务的配置与管理:FTP、HTTP、DNS、NFS、Samba、DHCP等 网站
资质认证
技能
搭建日志可视化平台 主要功能为 1、规范化web服务器、app等的日志格式,方便分词采集。 2、使用flume、filebeats、kafka、redis、logstash、elasticsearch、kibana来做日志的采集、传输、分词存储等 3、该日志系统提供给支持部门查询客户可能出现的问题。 4、该日志系统作为数据源使用web入口的http_code提供系统sla信息监控。
granfana+prometheus监控搭建,监控135台机器 Prometheus是一个开源监控解决方案,用于收集和聚合指标作为时间序列数据。更简单地说,Prometheus 商店中的每个项目都是一个指标事件,并带有它发生的时间戳。