个人介绍
我熟练掌握多种操作系统、数据库、中间件、服务器和网络设备等,能够快速解决复杂的系统难题,是一名经验丰富的运维工程师。
工作经历
2021-11-01 -至今湖南卡罗德音乐集团有限公司运维工程师
1. 设计运维体系的总体技术方案、制定合理可靠的灾备应急预案以及合规的运维管理制度等; 2. 线下环境的服务器、网络、虚拟化平台、数据库、中间件、及其它支撑系统的部署与维护; 3. 公有云上云主机、存储、网络、SLB、CDN、RTC、DNS、SSL、短信及备份等云产品的配置; 4. 业务系统的环境初始化、部署、更新发布、日志分析、故障处理、协助排查线上业务问题; 5. CI\CD体系的规划与建设、开发运维脚本、引入自动化工具如Jenkins等,推动运维自动化; 6. 监控预警系统(Prometheus体系)的部署与配置,实时掌控系统状态,根据监控数据有针对性地进行系统的调整与优化,提升系统稳定性、可用性及资源使用效率; 7. ELK日志系统、Skywalking性能监控系统的搭建与维护,协助团队开发更高效地排查问题; 8. 日常系统状态巡检,配置和数据的备份与还原,硬件资产、系统资源和系统容量的统筹管理; 9. 制定运维规范,编写相关文档,沉淀技术积累,及其它跨部门协作; 10. 新技术的预研与落地,提升运维工作的效率,提升团队生产力。
2016-03-01 -2021-10-31湖南视拓信息技术股份有限公司运维工程师
1. 新项目实施工作,包括硬件服务器的上架、安装、调试和RAID配置;系统安装,网络配置,存储挂载,应用环境初始化;vmware vsphere虚拟化平台安装配置,K8S平台部署,Oracle数据库的安装、配置及初始化,业务系统的部署与运行调试,部署文档输出等。 2. K8S集群管理与维护,应用从代码构建到打包Docker镜像、应用部署、更新、及回滚等操作,服务发现与负载均衡的配置,存储管理,配置管理,集群资源与状态监控,POD运行节点调度,证书更新,硬件资源自动扩缩容等; 3. 定期对客户的服务器状态与系统资源(Linux/Unix/Windows)、业务系统(MES/ILS/IMS等)、Oracle数据库系统开展巡检工作,发现并解决问题,出具巡检工作报告; 4. 故障排除和问题解决:包括Oracle数据库、K8S集群、Linux系统和VMware vSphere等的故障进行排查和解决。通过分析监控数据和日志信息,查找根因,对症处理问题。通过团队协作,解决综合技术领域的问题; 5. 其它工作,包括应用的部署与配置;系统故障处理、性能调优、资源管理和容量规划;执行系统补丁和安全更新等;
2011-11-01 -2015-12-31长城宽带网络服务有限公司网络工程师
1. 负责网络机房设备(路由器/交换机/防火墙等)的配置与维护;处理网络设备故障,确保网络的高可用性和稳定性; 2. 监测网络性能,分析流量和延迟数据,识别潜在的瓶颈,并通过优化网络配置提升带宽利用率和响应速度; 3. 迅速响应网络故障,通过分析日志和监控数据,快速进行故障诊断和修复,以最小化服务中断,保障持续运行 4. 参与网络架构的设计规划,共同制定网络建设方案,在方案实施过程中提供专业技术支持,确保方案的高效实施; 5. 策划网络的扩展升级,以满足日益增长的流量需求;制定容灾和备份策略,以确保网络的可靠性和业务的持续性。
教育经历
2016-09-01 - 2019-06-30湖南大学网络营销与管理本科
顺利完成学业,获得毕业证与学位证。
资质认证
技能
1. skywalking-oap+skywalking-webapp+Elasticsearch+skywalking-agent探 2. 通过skywalking系统,可以直观的监控应用性能,进行链路追踪,编译开发人员排查
1. 主要组件 Elasticsearch+Logstash+Kibana+Filebeat+Kafka 2. 实现日志的收集、过滤与展示,包括系统日志、微服务日志、数据库日志、Nginx日志等,便于快速排查定位问题