基于用户APP行为特征提取人群包

我要开发同款
SG不是帅哥2023年07月11日
148阅读
开发技术python
所属分类hive、pyspark、二分类、机器学习

作品详情

项目描述:从每月十亿级别的手机卡用户中,以APP行为频次作为特征,建立二分类评估模型,提取最相近于已转化手机卡用户的手机号进行打包,投入于广告平台作为广告计划的投放定向。
项目角色:特征工程、落实业务
读取hive数据库获取手机卡用户APP数据,计算APP使用频次与时长(天) 并对其进行格式化,以月为单位保存至数据库准备进行特征工程。获取正样本数据(已转化手机卡用户)保存至hive数据库。
进一步计算APP行为数据、进行归一化与向量化、获取特征向量。计算指定月APP使用频次与时长、归一化之后作为当月APP使用特征。对比两个月的数据,计算APP使用频次与时长变化,作为APP使用变化特征。获取待观察APP列表,进行过滤后进行向量化,作为最终模型训练的数据,为特征向量打上正样本与负样本标签。
根据业务需求,获取经过模型预测后的数据。指定业务需求数据量、是否重复获取历史数据、是否转存等选项,将以上选项作为入参,执行数据获取的脚本,根据模型预测时给予样本的评分,递减的原则去获取数据,将结果保存至文本文件用于互联网广告投放的用户定向设置。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论