工作经历
2021-09-14 -至今国美电器java开发专家
一、企业简介:国美电器成立于1987年元月一日,是一家以经营各类家用电器为主的全国性家电零售连锁企业。本着“创新务实、精益求精”的企业理念,依靠准确的市场定位和薄利多销的经营策略,得以蓬勃发展。国美电器在中国大中型城市拥有直营门店1200多家,年销售能力1000亿元以上。 二、职责业绩: 1. 集群管理:负责公司超过5000+实例、百亿对象存储、超千亿日请求量的Redis集群管理和维护,包括集群的规划、创建、扩容缩容、集群迁移、拆分等等。 2. 平台研发:负责公司缓存管理平台部署、运维和研发,对日常运维功能进行定制开发,实现集群健康度检查、按分片或规则进行数据清理、实例克隆等等定制功能。 3. 技术攻坚:日常故障分析、排查和解决,各版本Redis调研,缓存管理平台扩展升级等等。 4. 技术支持:开发、设计、测试缓存SDK客户端,以及对使用SDK的业务研发进行技术支持。 5. 资源治理:统计不使用的集群,联系业务组进行集群下线和资源回收。 6. 灾备方案:提升集群数据完整性,应对机房掉电、中毒等问题,规划交易链路redis灾备方案。
2015-11-01 -2021-08-01北京新东方迅程网络科技有限公司资深开发工程师
一、企业简介:新东方在线(www.koolearn.com)新东方教育科技集团旗下专业的在线教育网站。作为唯一的综合网络培训机构入选中国互联网协会正式公布的首批"绿色网络文化产品"名单。2007年5月进军数字图书馆领域,与全国数百家高等院校展开合作,为大学在校生提供新东方原创英语学习视听课程。连续5年蝉联“全国十佳网络教育机构”。 二、职责业绩: 1. 平台研发:负责各种平台、框架、工具的开发,以及体系建设。梳理复杂业务流程,合理划分领域,抽象系统,提炼成中台,以提高研发效率。参与并完成云平台、DevOps发布平台研发,独立处理涉及服务器、nginx、权限、cicd、jenkins、git、grafana、apollo、k8s等各方问题。 2. 技术攻坚:基于本人资深技术优势,对于项目或公司系统运营中出现的棘手、复杂问题进行技术预研与攻坚。在职期间累计解决技术攻坚10个以上如:重写CRM系统订单业绩计算、消息中心高消息量优化、老旧合同系统迁移、售前系统优化改造等。 3. 需求分析:根据项目具体情况进行需求调研,梳理复杂业务流程,根据产品功能完成相应模块的需求分析。 4. 研发管理:编写
教育经历
2018-09-01 - 2021-01-01北京理工大学计算机科学与技术本科
2008-09-01 - 2011-07-01石家庄计算机职业学院软件技术专科
资质认证
技能
项目背景:新应用的申请要登录多个不同的平台填单子,发邮件,流程繁琐复杂。 技术路线:使用springboot开发框架,前端框架使用VUE 和AdminLTE,使用Shiro+ Oauth2作登录认证和权限管理。 职责业绩: 1. 流程梳理:梳理公司多套环境(开发、测试、预发布)多种类型(springmvc、dubbo、job、worker、springboot、UI、Nodejs等)的应用的申请流程。 2. 功能实现: 应用平台:设计、搭建、开发公司的应用云平台系统,提供了较为自动化的表单获取项目的git地址。 人效提升:提炼应用的信息模型,重新梳理了应用申请创建流程,提升了开发人员80%的人效。打通了应用在Jenkins平台创建、Docker环境部署、Nginx域名绑定、Jenkins发布的全流程的自动化平台。 统一管理:项目端口让公司首次拥有内网环境应用的统一管理、信息收集的功能。极大的提高了开发人员申请环境的效率,减少环境管理人员部署所需的时间。 一键申请:实现多个中间件平台(Apollo、RocketMQ、Redis、Jenkins等)的多环境资源的一键申请功能。 单点登录:为公司的中间件(Jenkins、Redis缓存、Apollo、Grafana等)及公司其他工具项目提供单点登录的功能。 聚合入口:提供了聚合入口、完成了应用直达相应的监控、发布、日志等节省大量开发人员时间 文档编制:设计文档、SDK文档、常见问题解决文档完备。 接口提供:给中间件、运维等功能提供应用的API接口。
项目背景:缓存管理平台要运维管理近300台服务器,300多个集群的5000多个实例。 技术路线:基于开源项目cachecloud平台结合公司的使用场景进行定制扩展开发。使用技术为springboot、jedis、mybatis、mysql,前端使用 jsp、vue、element-ui等等。 职责业绩: 1. 功能实现: 集群管理:集群部署过程中通过机房机器、单机实例数、可用内存、预留内存、主从分布、端口占用的综合条件进行集群实例配置的推荐和分配逻辑。 机器克隆:机器故障后快速对故障机器实例进行一键克隆迁移处理,快速避免单点风险,并且控制同时启动实例数量,避免高并发和同步造成的CPU及网卡高负载。 密码兼容:对平台进行密码兼容性改造,实现平台同时支持部署、运维、检查、采集带密码和不带密码的缓存实例。 数据清除:实现按前缀规则、按key、按分片等多种场景下清除redis缓存数据。 健康检查:平台与shell脚本联动实现集群健康检查,一键检查集群实时实例状态、实例redis版本、连接数、已用内存、最大内存、角色、qps、槽位完整性、主从实例数等信息。对平台的集群的异常状态节点、冗余配置冗余实例、裸master节点、主从数异常节点的定时检测及告警。 数据迁移:平台redis数据迁移工具同时支持redis-migrate-tool和redis-shake两种工具,且支持迁移服务器同时启动多个迁移任务,并将迁移任务加入到falcon存活检测。 批量启停:实现指定机器实例批量启动和停止,提高故障处理效率。 SDK开发:开发SDK支持动态调整集群配置地址信息,调整并发限制,切换集群配置等,并按Redis版本特性对SDK进行升级,支持高版本新命令。调整SDK以支持密码实例。以及对使用客户端的SDK的信息进行采集等等。 容灾策略:对于高优先级的集群,实施跨机房容灾备份策略,实现分钟级的动态故障恢复措施,极大提高业务的稳定性。