个人介绍
1、3年深度学习工作经验,主要方向为计算机视觉、自然语言处理、强化学习、多模态。
2、熟悉并掌握python、c++语言。
3、熟悉nlp中意图识别,实体识别,情感分析、文本匹配,信息抽取、阅读理解、文本生成、知识图谱、text2sql、文本纠错领域常见算法。
4、参与开发聊天机器人、对话系统等项目,熟悉整体架构,以及各模块算法。
5、熟悉cv中目标检测、图像分类、视线估计、图像生成、语义分割、情绪分析领域常见算法。
6、熟悉多模态transformer预训练模型CLIP、ALBEF、BLIP;熟悉AIGC主流模型DALL-E、DALL-E2、Stable Diffusion。
7、熟悉强化学习中ppo、dqn、ddpg等常见算法。
8、熟悉模型推理加速、熟悉主流部署方式,onnxruntime,libtorch,tf-serving等。
工作经历
2022-05-01 -至今腾银nlp算法工程师
1、负责FAQ机器人系统整体开发,其中包括召回模块、精排模块。 2、负责浦发银行智能识别项目开发,其中包括意图识别、实体识别、实体标准化、模型压缩、模型加速、模型部署。
教育经历
2017-09-01 - 2020-06-30重庆理工大学计算机技术硕士
专业排名前1%-5% 在校期间发表2篇论文:1篇北大核心期刊;1篇EI
技能
1、负责浦发银行智能识别项目开发,其中包括意图识别、实体识别、实体标准化、模型压缩、模型加速、模型部署。 2、在难度较高的意图识别模块,利用层次标签分类和投票模型进行优化。 3、在实体标准化模块,利用tire树优化的正则匹配。 4、在模型压缩部分,在保证分类精度的情况下,用量化压缩模型大小为原来的1/4。 5、完成私有化docker部署,用onnxruntime加速模型,接口请求平均响应时间50ms。线上性能 稳定性指标:tps40+,单进程内存稳定在200M左右。cpu利用率稳定在75%。