## 互联网广告(开始时间不详,止于2020.11)### 概述运用大数据技术细分用户喜恶,再根据用户喜恶权重投放广告,从而大幅提升了广告的转化率。### 实现数据采集:- 使用Flume从各日志服务器采集埋点日志到Kafka。- 使用Sqoop从MySQL导入数据到HDFS。数据处理:- 实时 - 使用SparkStreaming实时处理来自Kafka的数据并保存结果到Redis。- 离线(先用Flume从Kafka采集数据到ODS层,此步骤起到一个备份的作用。再用Spark清洗数据到DWD层,用于离线处理的统一入口) - 使用Hive分层搭建数仓并保存结果到MySQL。 - 使用Spark对用户打标签并保存结果到HBase。 - 使用推荐算法分析数据并保存结果到MySQL。数据展示:使用ECharts展示数据。### 个人职责搭建Flume集群。参与Spark离线编码(含ETL)。使用Hive离线编码。打标签以生成用户定向。对接后端人员。协助测试人员。参与会议。杂项任务:校验数据。声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论