离线数仓:在服贸会的官方网站上获取数据信息,存入第三方数据库中,从mysql库中获取信息,利用公司的城操调度,T+1的形式存入hive库中。由大数据工程师通过 hive 的分层建模,需要得到各省市区,境外的参展商,专业观众,新增企业数、疫情下的人流量、票务证件的使用情况、各地区的订单金额等有效信息,通过城操调度将数据结果存放在 MySql 中。然后将数据并进行分析以及调用数据进行数据BI报表展示。
实时数据:通过接口,接入入场人的信息,通过闸机获取公安的个人核算报告,然后通过FlinkSql进行计算。
接入大屏进行展示。
业务需求:
省市区:行业分析、组展机构、展品展馆
年 度:企业新增、用户分析、新增参展商
月 度:公司概况、主播分析、内容分析、地域分布处理日度、月度金额占比、订单增长率
周 度:直播数据,直播观看人数,直播间pv,uv统计,洽谈间人次,各网站浏览pv,uv
直播分析:论坛活动,会议直播
会展数据:当日进场人数,当日票务总计,当日制证总计,闸机人数统计,展馆人数统计
各pv,uv来源:官网,APP,小程序,H5
展台/