嫦娥(阿里云ECS统一运维平台)

我要开发同款
半_夏2024年01月04日
124阅读
开发技术redis、rabbitmq、spring、多线程、java

作品详情

项目描述:阿里云弹性计算统一运维平台,致力于帮助产研、售后、运营等不同角色提供定制化的工作台,解决日常运维问题,提升工作效能和幸福感。前端采用微前端的方式,按业务模块拆分到不同的前端项目,各项目采用不同的技术栈实现,同时提供了低代码配置页面的能力。后端使用 SpringBoot2.x框架,开发语言为 Java和 Kotlin ,单元测试框架用 Junit和 Jmockit ,分布式任务调度采用 Schedulex ,缓存采用本地缓存 Caffeine 和分布式缓存 Redis ,数据库用 Mysql 。分布式部署在三个地域,每个地域通过集群的方式部署,共有15台机器。
核心模块:ECS 运维平台(ECS 、云盒、磁盘等运维工具)、SRE 工作台(ARMS 监控平台、预警平台、Meta 管理、发布大盘等监控以及故障恢复工具)、研发工作台(日志服务、全链路追踪系统、bpms 审批流框架等)、售后工作台(工单处理、诊断工具、智能机器人,周报系统,自动授权等)
主要工作:
1. 嫦娥1.0 -> 嫦娥2.0(模块化、能力集成)-> 嫦娥3.0(平台化、工作台、智能化运维)架构升级中核心方 案的设计和需求研发。
2. 嫦娥框架升级重构的核心方案输出和开发(SpringBoot 框架升级、Dubbo3.0的升级、弹内到 OXS、bpms 审批流统一框架、ACL 权限控制等 )。
3. 实例运维模块设计、开发、压测。
4. 值班系统的调研、设计和开发。
5. 嫦娥的日常运营和迭代管理,包括设计文档知识库和用户手册知识库的建立、研发规范的制定、月报输出和新功能的推广分享、oncall 机制的建立和运行、迭代管理等。
6. 代码 review 、日常线上问题的处理。
工作成果
1. 制定项目迭代运营制度,输出嫦娥智能化演进过程的核心方案。使嫦娥的 uv 从原来的300+上涨到现在的1500+
2. 负责多个核心模块的设计和开发,其中 bpms 统一接入框架将原本1人/3天的工作效率提升到1人/0.5天。
3. 通过懒加载、并发等技术优化原来的实例查询功能,将平均响应时间从1~4秒降低到0.6秒。通过并发、异步、分组等方式搭建
4. 基础的异步任务框架,优化原来的实例运维模块,优化用户体验,获得客户一直好评。
5. 负责 springboot 框架升级、dubbo3.0的升级、弹内到 OXS 的迁移、ACL 重构等核心模块的设计和开发以及灰度发布,保证项目的按时完成和质量达标。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论