柳枫隐去
1月前来过
全职 · 500/日  ·  10875/月
工作时间: 工作日19:00-00:00、周末09:00-21:00工作地点: 远程
服务企业: 7家累计提交: 1工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

3年以上的数据挖掘和机器学习开发经验,专注于数据科学领域的学习和研究,参与过多个项目的算法部署落地,善于思考,沟通能力强,具有较强的业务能力,技术体系完善,同样具备nlp和cv方向的开发能力。涉及AI领域的项目都有做过,复杂的包括机器翻译,ocr识别,人脸识别,推荐系统,问答等;简单的问问挖掘,数据挖掘,分词等都有涉及。

工作经历

  • 2020-02-05 -至今趣加算法

    一.用户预测相关模型开发与线上部署 项目简述:基于 Funplus 几款游戏内的玩家行为数据,对玩家做时间序列方面的预测(时间 颗粒度:按天),主要包括流失预测和付费预测两大类,具体如下: 1. 流失预测:包括用户流失预测和用户活跃度预测模型 核心部分:主要是对数据进行预处理和特征工程,其中主要是利用滑窗的思想对时间序列数 据进行特征画像(核心时间窗口:候选窗口,历史窗口,观察窗口),训练目标是未来几天用户 是否流失;模型方面选择的是 LGBM 算法框架和 Bi-lstm 模型; 2. 付费预测:包括用户付费概率预测和大 R 预测模型 核心部分:数据处理基本和上面一致,特征工程部分滑窗的思想保留,这里的特征工程画像 主要是围绕着付费进行设计和处理的,包括利用 RMF 模型处理特征等,训练目标是玩家未 来几天是否付费;模型方面依然选择的是 LGBM 算法框架和 Bi-lstm 模型,这里模型在训练 的时候根据用户的生命周期 LV 进行了细化训练; 3. 模型训练管理和线上部署:这里模型训练过程中使用 mlflow 框架对模型训练进行管理和 可视化,主要是能保留和跟踪每一次模型训练的结果和

教育经历

  • 2015-09-10 - 2018-06-06北方工业大学信息与通信工程硕士

    北方工业大学硕士学位,通信工程专业毕业,导师项目都是AI方面的,毕业后也是从事相关工作。

技能

深度学习
机器学习
图像识别
自然语言处理
0
1
2
3
4
5
0
1
2
3
4
5
作品
推荐系统

推荐算法 主要在工业界使用了推荐算法在我们的系统中 1.召回算法 itemcf 物品协同过滤 实现 由此产生了基于物品的协同过滤(itemCF)给用户推荐和他们之前喜欢的物品相似的物品。不过ItemCF算法不是根据物品内容属性计算物品之间相似度,它主要通过分析用户的行为记录来计算物品之间的相似度。 2.基于物品的协同过滤算法主要分为两步: 1):计算物品之间的相似度 2):根据物品之间相似度和用户的历史行为给用户生产推荐列表。 3.LFM 实现 LFM算法是属于隐含语义模型的算法,不同于基于邻域的推荐算法。 4.Personal rank 实现 基于图的推荐算法,类似于Page Rank 算法

0
2023-05-02 03:47
NLP 序列化标注

1. 机器翻译分词模块:主要是基于开源分词数据+互联网新词+公司聊天累计数据等来优化 分词模块;包括基础预料预处理的标准制定、数据清洗、模型训练、线上对接翻译系统和相 关部署;模型训练主要是基于 CRF++框架和 Bilstm-crf 两种算法进行实验对比,两个算法最 终的结果都优于 jieba、hanlp 等开源的分词;最终上线的是 crf++,部署方式是 flask。 2. 实体识别和抽取:主要针对于翻译中出现的中文实体进行优化和抽取;主要是对中文人 名/地名/音译名等进行抽取和识别模块;该部分主要基于人民日报数据+常用人名(包括外 国音译和日本名等),算法用的 bilstm+crf,部署也是 flask。

0
2023-05-02 03:48
用户预测相关模型开发与线上部署

项目简述:基于 Funplus 几款游戏内的玩家行为数据,对玩家做时间序列方面的预测(时间 颗粒度:按天),主要包括流失预测和付费预测两大类,具体如下: 1. 流失预测:包括用户流失预测和用户活跃度预测模型 核心部分:主要是对数据进行预处理和特征工程,其中主要是利用滑窗的思想对时间序列数 据进行特征画像(核心时间窗口:候选窗口,历史窗口,观察窗口),训练目标是未来几天用户 是否流失;模型方面选择的是 LGBM 算法框架和 Bi-lstm 模型; 2. 付费预测:包括用户付费概率预测和大 R 预测模型 核心部分:数据处理基本和上面一致,特征工程部分滑窗的思想保留,这里的特征工程画像 主要是围绕着付费进行设计和处理的,包括利用 RMF 模型处理特征等,训练目标是玩家未 来几天是否付费;模型方面依然选择的是 LGBM 算法框架和 Bi-lstm 模型,这里模型在训练 的时候根据用户的生命周期 LV 进行了细化训练; 3. 模型训练管理和线上部署:这里模型训练过程中使用 mlflow 框架对模型训练进行管理和 可视化,主要是能保留和跟踪每一次模型训练的结果和过程;线上部署,因为是任务调度型 的,主要就是写调度流程和并行处理的框架,支持多项目配置,自动获取项目任务等,利用 supervior 保证程序 24 小时稳定运行。

0
2023-05-02 03:50
更新于: 2022-04-11 浏览: 286