点击空白处退出提示
作品详情
### 概述
运用大数据技术细分用户喜恶,再根据用户喜恶权重投放广告,从而大幅提升了广告的转化率。
### 实现
数据采集:
- 使用Flume从各日志服务器采集埋点日志到Kafka。
- 使用Sqoop从MySQL导入数据到HDFS。
数据处理:
- 实时
- 使用SparkStreaming实时处理来自Kafka的数据并保存结果到Redis。
- 离线(先用Flume从Kafka采集数据到ODS层,此步骤起到一个备份的作用。再用Spark清洗数据到DWD层,用于离线处理的统一入口)
- 使用Hive分层搭建数仓并保存结果到MySQL。
- 使用Spark对用户打标签并保存结果到HBase。
- 使用推荐算法分析数据并保存结果到MySQL。
数据展示:使用ECharts展示数据。
### 个人职责
搭建Flume集群。
参与Spark离线编码(含ETL)。
使用Hive离线编码。
打标签以生成用户定向。
对接后端人员。
协助测试人员。
参与会议。
杂项任务:校验数据。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论