点击空白处退出提示
平台羊毛党用户透明化
我要开发同款作品详情
1. 与业务部门商讨羊毛党的相关特征,基于业内的普遍认知(会员经验低,折扣订单数大,登陆次数少,拉新数量大、访问到下单时间短的用户为羊毛党可能性较大)确定需要从数据库中提取的维度。
2. SQL 提取一年各月的订单数据,总计144万个样本,构建订单信息。
3. 构建用户信息特征:会员编号、会员姓名、性别、会员经验、折扣订单数、年登录次数、下单量、年消费额、折扣订单数占比、平均访问到下单时间、与上次登录的时间差(天)等、拉新用户数。
4. 选取训练模型需要的特征:会员经验、年登录次数、年下单量、年消费额、折扣订单数、折扣订单数占比、总折扣额、访问-下单时间、与上次登录的时间差(天)等、拉新用户数。
5. 特征处理:处理异常值、重复值、空值。数据标准化。
6. 模型选择:使用K-means聚类模型分别测试不同参数 cluster(簇)值,将轮廓系数最大的作为模型的参数。
7. 最终结合业务方确定合适的簇值。确定羊毛党,打上标签。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论