1、通过flume和kafka等组件工具采集数据,使用flink流引擎进行数据的清洗和入库2、针对采集的数据进行建模,针对需求设计数据仓库,对数仓分层建模等3、针对场景需求,使用spark和flink等引擎组件分别对数据进行批计算和流计算
评论