点击空白处退出提示
作品详情
用户行为数据抓取:
华为商城 APP 、华为商城 PC版,第1次版本用的是谷歌的埋点,用户行为数据都在谷歌数据库,所以得先有谷歌数据分析师的资格账号,通过 API 接口获取所有用户行为数据,包括用户账号,M号,手机号,男女,点击时间点击产品,产品的路由,停留的时间,使用的浏览器,使用的硬件等等。
通过这些数据抓取之后写入 hive 数据表,并且作为原始数据分类分区,在用 SQL 脚本清洗以后写入 oracle 数据库。
华为商城第2版是自己的埋点,数据通过卡夫卡写入消息队列,后端消费数据到 hive ,要做到数据兼容v1版本。
这个过程衍生出两个小产品:
一个是用户行为,点击产品热力图,通过插件方式在 APP 端展示用户点击的最热产品,运维人员可以实时的看到效果。
第2个产品是防黄牛封控系统数据,通过 API 端口数据流的分析,可以知道用户的点击频率。把超过阈值的频率的账号,我们会收集起来给运维分析。
项目主要技术内容
日志采集(Flume+kafka)
日志入库(Flink+HDFS)
数据清洗(scope+hive)
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论