kyeung
1月前来过
全职 · 1000/日  ·  21750/月
工作时间: 工作日09:30-18:30工作地点: 远程
服务企业: 2家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

全球500强大厂算法工程师,有多年正式生产项目推荐算法系统设计及自然语言处理等由0到1的Python开发落地经验,熟练掌握主流深度学习,如协同过滤召回算法,DeeFM排序算法,基于BERT预训练语言模型的文本分类、多标签标注等。掌握机器学习基本理论,主流有监督算法(线性回归,逻辑回归,随机森林等),聚类算法(KMeans等)等。开发出身,编程功底扎实,熟练掌握Python、Java、C#,C等语言。

工作经历

  • 2021-12-16 -至今沃尔玛(中国)投资有限公司算法工程师

    ● 开发搜索算法系统的意图识别模型及服务接口,通过梳理及归纳商品类别作为意图类别,整理和清洗query及 其对应的意图类别数据,在BERT语言模型的结构基础上调整成意图识别模型结构,精调训练出模型并封装成推 理服务接口,模型预测准确率达0.85左右; ● 开发用户评论多标签推理模型及服务接口,编写每天定时调度作业脚本,每天定时批量推理用户评论的多个标 签,智能监控用户评论舆情情况; ● 开发基于BERT语言模型的计算相邻token embedding向量相似度的新词发现,整理和清理上亿级的query, 产品名,品牌名,类别名等的语料数据,通过BERT计算语料中的相邻token embedding的相似度,从而计算 出合理的词语并计算词语置信度,再通过旧词去重得出新词列表,最终输出上百万个理论上的新词,从而为搜 索算法系统的分词词典提供新词来源; ● 整理及清洗上亿级零售行业语料数据,对中文BERT语言模型进行垂直零售领域数据的增量训练,使中文BERT 预训练模型更贴近零售行业的信息,使我们基于中文BERT的训练和应用效果进一步提升;

  • 2019-11-11 -2021-08-02广州致景信息科技有限公司数据算法leader

    ● 负责从0到1 feed流场景下推荐算法研发(包括但不止召回,排序等),根据用户行为构建用户画像、标签系 统等,进行个性推送算法设计和优化,完成推荐后台相关功能开发; ● 设计及开发推荐系统召回层,参考Youtube经典召回架构中的基于深度学习的Embedding+MLP,以用户特征 作为输入,离线训练出User Embedding及Item Embedding并存储,在预测召回候选集时利用局部敏感哈 希,快速搜索出该用户Embedding向量的K近邻,作为候选集,大大提升召回效率等; ● 设计及开发推荐系统排序层,利用DeepFM深度学习模型结构建立模型,同时学习低阶和高阶的组合特征,相 比召回包含更多User和Item的特征,以CTR作为预测目标,大大提升预测准确率等经典评估指标; ● 利用Word2vec及引入Attention注意力机制的循环神经网络等技术训练模型,进行评论情绪分析,预测评论是 否积极; ● 进行推荐系统相关数仓事实表,维度表的建模设计,实现算法数据使用前的数据处理开发; ● 负责推荐算法的应用与调优,提升推荐效果,成交率提升约18%以上; ● 设计及撰写《纺

  • 2018-09-01 -2019-11-12创立男士穿搭自媒体号数据算法leader(核心创始人)

    ● 爬取男士穿搭网站图文数据作为素材保存到本地,设计并制作PPT视频; ● 挖掘平台账号数据,进行特征值处理,再通过随机森林,深度神经网络算法等建立分析模型并进行分析预测, 分析运营情况,提高粉丝增长率,粉丝活跃率等,通过数据分析达到最高一天增长近万名粉丝,单个视频最高 播放量近100万次;

  • 2016-09-01 -2018-09-15广州扬临信息科技有限公司数据总监(核心创始人/算法/产品)

    ● 负责宠物推荐系统从0到1开发(包括但不止召回,排序等),构建宠物、用户画像等; ● 使用友盟数据收集框架,并制定额外的特征值埋点收集,再通过随机森林,深度神经网络算法等建立用户画像 模型、关联分析模型、智能定价模型、用户增长模型进行分析预测等; ● 负责宠物交易平台数据仓库从0到1Kimball维度建模设计,包括数仓层级,表命名规范,数据域划分等; ● 爬取百度百科有关宠物方面的图文数据,提供给APP展示用; ● 编写商业计划书中,数据分析报告展示部分,成功与10间以上的创投机构洽谈,以及多次被邀请参加路演等; ● 主动学习新的技能,定期参加技术大会,提升自己的专业素养;

教育经历

  • 2008-09-01 - 2012-07-15广州大学松田学院电子信息工程(通信方向)本科

    本人通过在本科的学习中,扎实了技术开发以及数学基础,为人工智能方面的发展打稳重要根基

技能

深度学习
机器学习
自然语言处理
特征处理
0
1
2
3
4
5
0
1
2
3
4
5
作品
垂直电商APP推荐算法系统

从0到1一个人开发电商APP的推荐算法系统,ETL处理计算特征数据,通过协同过滤算法做item的粗筛召回,再通过DeepFM之类的排序算法模型进行精排,推理每个召回item的CTR,再倒序排列返回

0
2023-04-28 18:24
搜索算法系统新词发现

通过bert推理出每个token的embedding,再计算语料中相邻token之间的相似度,高于阈值就组合起来,低于阈值就不组合,然后再计算组合出的词语的整个置信度,可以看出,不少词语是常见词,其余通过百度也能得知是品牌词等,通过这样计算自动为搜索算法系统的分词词典提供充足的词源,提供分词质量

0
2023-04-28 18:25
搜索算法系统意图识别模型

图分別为query是“草莓”或“牛奶”对应的意图推理类别结果,结果为得分降序排列,可以看出,推理还是十分符合常理,头几位分別是相关的类别

0
2023-04-28 18:26
更新于: 2022-05-26 浏览: 284