数据化服务平台2.0

我要开发同款
时间的时2024年06月12日
44阅读
开发技术spark、mysql、hdfs、hadoop、java
所属分类大数据

作品详情

技术栈:SparkSQL,Hive,Flinkx,ClickHouse,海豚调度,数仓维度建模,Kafka,PolarDB
数据化服务平台提供了各种业务数据的分析与展示,便捷地获取完整、准确、丰富的数据分析结果,支撑业务精准和快速决策。但由于1.0版本的数据存储与计算完全基于Mysql,导致数据计算过慢,历史数据无法获取,对于一些复杂指标的统计无法直接通过Mysql中现有数据直接计算得到。所以数据化服务平台中需要一种新的存储及计算方式。2.0版本使用数据仓库进行改造,并结合大数据能力进行存储与计算,彻底解决了1.0版本中存在的性能瓶颈与功能缺失。
我在项目中的职责:
1.设计数据化服务平台2.0整体功能架构;
2.数据仓库主题划分、各层模型设计与创建(ods,dwd,dws,ads);
3.Flinkx部分同步任务编写;
4.数据仓库核心数据加工任务开发;
5.海豚调度配置整体任务流程;
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论