分布式基因数据生产自动化云平台;

我要开发同款
数据分析张小凡2022年08月29日
153阅读

作品详情

项目名称:GeneFactory分布式基因数据生产自动化云平台
时    间:2018年7月至2019年7月(项目周期12月)
项目概述:(项目人数10人)
该项目主要是实现对实验室给出的DNA测序数据进行分析提取并根据算法进行运算最终给出用户报告数据。因为生物数据分析步骤复杂,人工操作易出错,系统采用argo+k8s云计算架构,实现了流程编排,自动化触发运行,几十多台服务器分布式对DNA数据的初步提取,以及用户报告的生成。
业绩和成果:
系统完成后,能够实现自动化数据分析为用户生成结果报告,给公司创造了交付价值。 从人工处理变成自动化处理,提高了处理效率,突破效率瓶颈,节省了人工成本。目前已经累计完成了接近一百万人的基因数据分析。最多同时运行200多台服务器,目前数据量级几百TB。

工作职责:
1、技术方案选型,功能模块和架构设计
2、部分功能的sdk模块的编写
3、项目管理和跨团队沟通
主要技术:
1、 底层主要采用了argo和k8s实现任务编排和分布式云运算
2、 存储方面采用了s3、mongodb,mysql等技术
3、 前端页面方面: html,css,js,vue
4、 后端sdk和API:java和python,springboot
5、 中间件:kafka
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论