苏晓峰
1月前来过
全职 · 1000/日  ·  21750/月
工作时间: 工作日07:00-23:00、周末14:30-18:30工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

1.对新技术有浓厚的兴趣,学习能力强

2.有较好的团体精神和较强的沟通能力,可以很好的适应与团队人员的工作交流和交接。

3.对数据有较强的敏感性。

4.工作仔细认真、积极主动、有耐心、责任心强。

5.计算机专业背景,有较多的数据分析建模经验和扎实的技术基础。

工作经历

  • 2019-09-10 -2024-05-28 数据建模师

教育经历

  • 2016-09-01 - 2020-07-01湖南工学院网络工程本科

技能

机器学习
爬虫
0
1
2
3
4
5
0
1
2
3
4
5
作品
国内某知名汽车品牌增换购推荐及流程自动化实现

项目描述:此项目意义在于帮助某汽车品牌,通过分析历史维修、保险、贷款、索赔等信息,选 取高效的特征去完成机器学习模型构建,挖掘可能存在二次购车意向的个人客户,并匹 配这些客户相关重要信息反馈给车企,以帮助其能更加精准的进行客户营销。 责任描述:此项目针对于该品牌下多个车系,我主要负责 某车型的增换购模型构建及编 写后续下发流程处理代码和实现后续跟进日报自动化操作: 1. 确定正负样本逻辑并编写 Spark-SQL 从客户数据库中取得所需一定数量正负样本并匹 配维修、保险等相关信息。 2. 根据相关业务建议进行模型特征衍生,选定多个时间观察点并选择其过去六个月、九 个月、一年内的相关信息统计数量作为衍生规则,编写 Python 代码衍生出所有特征。 3. 利用决策树算法对全量特征数据进行建模,打印出决策树,选取离根节点最近五个特 征,对所有特征进行 IV 值计算并选取五个高 IV 值特征与决策树选择出的特征相结合成 十个特征作为最终选定特征。 4. 选择逻辑回归算法编写代码分箱构建分类模型,调整正负样本数量及参数,计算其 auc 与 ks 值使其达到较好水平,完成模型构建并保存。 5. 取出所有数据进行选定十个特征数据衍生,并编写模型预测代码读取模型与分箱逻辑 对全量数据进行评分。 7. 选取一定数量高评分数据,编写下发流程代码对数据进行清洗,处理,得到客户要求 格式并通过邮件下发给到客户。 8. 后续客户要求制作日报跟进下发数据的使用情况,与客户确定逻辑后使用 Python 工 具编写日报自动化代码以实现日报自动化,节省人力。

0
2024-05-28 18:20
外网爬虫获取数据及市场分析的设计与实现

项目背景:在某发达国家房地产企业,为了对房屋实行有效的估价,需要获取目标房屋周围的市场情况 项目描述: 1.通过爬取多个外国房企网站获取房屋具体信息(基础信息和价格信息等) 2.对爬取的数据进行处理转换操作 3.制定有效数据筛选策略,为客户提前筛选掉异常市场数据 4.根据市场情况对当地市场进行回归分析,得到市场系数 5.基于其分析结果,对目标房屋进行市场估价 6.将基础信息数据以及估价结果数据通过 API 交付给客户

0
2024-05-28 18:17
国内某汽车大厂订单预测

项目描述:全国各大经销商每周会向汽车主机厂申报需要的各配置车辆数据订单,在智能互联快速 发展时代下,当前经销商订单自报依然依靠传统线下传递,人工判断,过程过于复杂, 效率过于低下;此项目摒弃传统手工式订单收集方式,采取构建模型,预测申报量及展 示相关销量信息的方式,建立一套操作性强、准确率高的智能化的订单分配系统,以帮 助通用汽车厂商提高订单自报/反馈业务处理效率,为决策提供数据支持,实现订单的智 能化推荐和良性循环。 责任描述:此项目中智能化订单项目开发设计框架类和搭建类的功能主要由客户上汽通用 IT 团队实 现,我担任的职责为订单的智能化推荐建议值及展示值的计算与输出: 1. 编写 SQL 代码从客户 hive 源数据库中得到建模及展示值所需要的大量数据表。 2. 选用模型,此项目为时间序列预测,时序预测一般使用两种模型进行预测:ARIMA 模型和时序转特征,Arima 对于数据的平稳性要求较高,时序转特征相对低一些;再综 合模型的数量和运算速度,最终我选用了时序转特征的方案。 3. 使用 Python 编写实现构建时序特征的代码及模型构建与模型预测代码。 4. 计算预测准确度与展示值正确性,测试达标后编写算法文档。 5. 编写定时任务,每周日自动运行 py 代码将每周结果表写入客户数据库。 6. 项目 close 后支持数据运维等相关工作。

0
2024-05-28 18:07
更新于: 2024-05-28 浏览: 218