搭建医药类的数据中台,从1.0的PGSQL迁移到2.0的大数据平台,整个中台划分为ldg、sta、ods、dwh、dmt等五层,离线模块中上游通过腾讯云的Cos系统上传当日或T-1日数据文件,通过自研应用DI拉取做处理到外部表ldg层,通过informatica工具进行调度,进而去做后续的ETL流程,整个过程中数据存放在HDFS,表结构使用HIVE。
评论