个人介绍
获得证书:RHCA、RHCE。
1、拥有5年运维经验,精通 Linux 系统管理,熟悉性能调优。
2、能够熟练使用 Ansible ,Shell 脚本实现自动化运维。
3、熟悉 Zabbix、Prometheus、 Grafana 、ELK Stack 监控平台的配置与维护。
4、熟悉 CI/CD ,gitlab、svn、jenkins。
5、熟悉 Docker,Kubernetes。
6、熟悉 KVM、ovirt 虚拟化,OpenStack、Ceph 。
7、熟悉 HA、LB(keepalived,haproxy,nginx) 技术。
工作经历
2021-06-22 -至今北京智因东方转化医学研究中心有限公司高级运维工程师
机房、服务器硬件的巡检与维护。 Linux系统及服务的安装、配置与维护,数据备份与灾备恢复,研究系统架构,系统性能优化。 分布式集群调度系统slurm、sge的部署与维护。 Nginx+keepalived高可用web集群的部署与维护,nginx的优化和日志采集分析。 Zabbix、Prometheus和Grafana监控系统的部署与维护,ELK日志分析平台的部署与维护,并实现ELK+Prometheus+Grafana的集成。 Ansible、Shell脚本自动化运维任务。 搭建CI/CD环境、gitlab、svn、jenkins等工具的配置与维护。 Ovirt虚拟化平台的管理与维护,节点扩容、虚机下发、engine节点的备份与恢复。 系统安全加固,Jumpserver开源堡垒机、OpenVPN的日常管理与维护。
2018-10-16 -2021-06-20长安通信科技有限责任公司运维工程师
Linux系统运行维护与监控,处理系统常见故障。 管理kvm虚拟机,通过ansible自动化配置管理,部署samba,nfs,nginx、dns等服务。 zabbix监控搭建与维护,监控数据采集展示,编写shell脚本实现运维任务自动化。 办公门户系统(邮箱、OA)日常维护、扩容,高可用架构搭建。
教育经历
2010-10-09 - 2014-07-01西安思源学院电子信息工程本科
技能
项目介绍:使用Prometheus+Grafana搭建监控系统,主要实现服务器基础指标监控,监控内容包括:服务器硬件资源,基础服务,应用程序。 实施过程: 1、搭建prometheus,配置自动发现主机和告警规则,使用systemd管理prometheus服务。 2、使用ansible在被监控主机自动化部署node_exporter,暴露监控指标。 3、安装alertmanager和prometheus-webhook-dingtalk插件,实现钉钉告警。 4、安装pushgateway作为中间网关,实现自定义监控数据采集。 5、安装grafana,添加prometheus数据源,配置dashboard,进行监控指标可视化。
项目需求:根据业务需求,需要部署一套音视频流量分析系统,处理全国各节点的音视频细分流量。服务器设备数量1700余台,分布在全国多个机房,利用现有系统进行升级改造,在物理机上构建虚拟化环境。 配置清单: 操作系统:Centos7.2 硬件配置:内存128G cpu64核 硬盘500G 虚拟化: KVM 虚拟机: Windows2008 R2 负责整体环境搭建: 1.控制节点部署ansible,创建配置文件,生成主机清单文件,配置SSH密钥。 2.被管理主机配置SSH策略,配置sudo免密提权。 3.通过ansible批量部署KVM虚拟机,通过虚拟磁盘和文件克隆虚拟机,配置网络地址 4.编写playbook,部署应用程序,编写jinja2模板文件更改配置,启动服务。 5.搭建samba共享文件系统,在windows客户端自动挂载,为分析程序提供数据持久化存储。
项目介绍:随着公司业务规模的不断增长,对服务器的需求急剧增加,需要部署一套企业内部的云基础设施。计划基于 OpenStack 部署企业私有云平台,使用 Ceph 分布式存储作为云平台后端存储,使用 Prometheus 实施云平台监控。 实施过程: 1、部署 Ceph (1)准备基础环境,安装依赖服务 podman 和部署工具 cephadm。 (2)使用 cephadm 容器化部署 Ceph 集群,通过 bootstrap 初始化集群。 (3)添加主机,部署 MON、MGR ,添加 OSD 设备。 (4)为 OpenStack 配置 Ceph 块设备,创建 RBD 存储 Pool ,配置客户端身份验证。 2、部署 OpenStack (1)准备基础环境,控制节点安装公共服务数据库、消息队列、缓存数据库等。 (2)控制节点安装 Keystone 身份认证服务、Glance 镜像服务、Nova 计算服务和 Dashboard。 (3)计算节点安装 Nova 计算服务,并安装网络组件。 (4)网络节点安装 Neutron 网络服务,并配置计算服务使用网络服务。 (5)存储节点安装 Cinder 块存储服务,为 OpenStack 实例和镜像提供块存储。 (6)配置 Glance、Cinder、nova-compute 集成 Ceph 存储。 3、部署 Prometheus (1)使用 Ansible 在云平台各节点自动化部署 Exporters ,暴露监控指标。 (2)配置自动发现主机和告警规则,使用 systemd 管理 Prometheus 服务。 (3)安装 Alertmanager和 prometheus-webhook-dingtalk 插件,实现钉钉告警。 (4)安装 Pushgateway 作为中间网关,实现自定义监控数据采集。 (5)安装 Grafana ,添加 Prometheus 数据源,配置 Dashboard ,实现监控指标可视化。 业绩:1、通过部署一套 OpenStack 私有云平台,将部分业务迁移上云,极大提升了服务器的资源利用率,提高了运维管理效率,为公司节省了成本。 2、使用 Ceph 作为 OpenStack 云平台后端存储,利用低成本的硬件实现了一套高性能和高可用的存储系统,降低成本的同时提供了出色的存储性能。 3、监控覆盖率100%。使用 Prometheus+Grafana 实现基于指标的监控仪表板,为定位问题、分析业务性能、优化系统瓶颈提供有力数据支撑。