个人介绍
全球500强大厂算法工程师,有多年正式生产项目推荐算法系统设计及自然语言处理等由0到1的Python开发落地经验,熟练掌握主流深度学习,如协同过滤召回算法,DeeFM排序算法,基于BERT预训练语言模型的文本分类、多标签标注等。掌握机器学习基本理论,主流有监督算法(线性回归,逻辑回归,随机森林等),聚类算法(KMeans等)等。开发出身,编程功底扎实,熟练掌握Python、Java、C#,C等语言。
工作经历
2021-12-16 -至今沃尔玛(中国)投资有限公司算法工程师
● 开发搜索算法系统的意图识别模型及服务接口,通过梳理及归纳商品类别作为意图类别,整理和清洗query及 其对应的意图类别数据,在BERT语言模型的结构基础上调整成意图识别模型结构,精调训练出模型并封装成推 理服务接口,模型预测准确率达0.85左右; ● 开发用户评论多标签推理模型及服务接口,编写每天定时调度作业脚本,每天定时批量推理用户评论的多个标 签,智能监控用户评论舆情情况; ● 开发基于BERT语言模型的计算相邻token embedding向量相似度的新词发现,整理和清理上亿级的query, 产品名,品牌名,类别名等的语料数据,通过BERT计算语料中的相邻token embedding的相似度,从而计算 出合理的词语并计算词语置信度,再通过旧词去重得出新词列表,最终输出上百万个理论上的新词,从而为搜 索算法系统的分词词典提供新词来源; ● 整理及清洗上亿级零售行业语料数据,对中文BERT语言模型进行垂直零售领域数据的增量训练,使中文BERT 预训练模型更贴近零售行业的信息,使我们基于中文BERT的训练和应用效果进一步提升;
2019-11-11 -2021-08-02广州致景信息科技有限公司数据算法leader
● 负责从0到1 feed流场景下推荐算法研发(包括但不止召回,排序等),根据用户行为构建用户画像、标签系 统等,进行个性推送算法设计和优化,完成推荐后台相关功能开发; ● 设计及开发推荐系统召回层,参考Youtube经典召回架构中的基于深度学习的Embedding+MLP,以用户特征 作为输入,离线训练出User Embedding及Item Embedding并存储,在预测召回候选集时利用局部敏感哈 希,快速搜索出该用户Embedding向量的K近邻,作为候选集,大大提升召回效率等; ● 设计及开发推荐系统排序层,利用DeepFM深度学习模型结构建立模型,同时学习低阶和高阶的组合特征,相 比召回包含更多User和Item的特征,以CTR作为预测目标,大大提升预测准确率等经典评估指标; ● 利用Word2vec及引入Attention注意力机制的循环神经网络等技术训练模型,进行评论情绪分析,预测评论是 否积极; ● 进行推荐系统相关数仓事实表,维度表的建模设计,实现算法数据使用前的数据处理开发; ● 负责推荐算法的应用与调优,提升推荐效果,成交率提升约18%以上; ● 设计及撰写《纺
2018-09-01 -2019-11-12创立男士穿搭自媒体号数据算法leader(核心创始人)
● 爬取男士穿搭网站图文数据作为素材保存到本地,设计并制作PPT视频; ● 挖掘平台账号数据,进行特征值处理,再通过随机森林,深度神经网络算法等建立分析模型并进行分析预测, 分析运营情况,提高粉丝增长率,粉丝活跃率等,通过数据分析达到最高一天增长近万名粉丝,单个视频最高 播放量近100万次;
2016-09-01 -2018-09-15广州扬临信息科技有限公司数据总监(核心创始人/算法/产品)
● 负责宠物推荐系统从0到1开发(包括但不止召回,排序等),构建宠物、用户画像等; ● 使用友盟数据收集框架,并制定额外的特征值埋点收集,再通过随机森林,深度神经网络算法等建立用户画像 模型、关联分析模型、智能定价模型、用户增长模型进行分析预测等; ● 负责宠物交易平台数据仓库从0到1Kimball维度建模设计,包括数仓层级,表命名规范,数据域划分等; ● 爬取百度百科有关宠物方面的图文数据,提供给APP展示用; ● 编写商业计划书中,数据分析报告展示部分,成功与10间以上的创投机构洽谈,以及多次被邀请参加路演等; ● 主动学习新的技能,定期参加技术大会,提升自己的专业素养;
教育经历
2008-09-01 - 2012-07-15广州大学松田学院电子信息工程(通信方向)本科
本人通过在本科的学习中,扎实了技术开发以及数学基础,为人工智能方面的发展打稳重要根基