个人介绍
算法应用方向:语言类大模型微调、文本分类、情感分析、推荐系统、智能营销;
技术栈:python、sql、pytorch、docker、hive
个人优势:多年互联网(腾讯、百度)大厂经验,用于丰富的AI算法模型应用经验;良好的有业务理解能力,能快速的将业务需求转化为技术问题;优秀的开发能力,快速的进行模型训练和部署等;
工作经历
2023-07-01 -至今北京百度技术有限公司高级算法工程师
通过数据挖掘、机器学习、深度学习等技术,支持文教互娱的策略研发工作 负责内容生成及AI编辑(prompt优化及个性化、P-tuning、大模型finetune等)、内容理解(质量分级、内容结构化、智能标签/摘要等)、场景应用(需求理解、用户刻画、个性化推荐)等 负责业界领先AI技术的调研和评估,对产品目标建模,持续优化模型效果,并提供核心技术支持 关注用户体验提升,通过对数据的洞察,深入挖掘产品潜在价值和需求,通过技术创新推动产品成长
2021-10-01 -2023-05-01腾讯云算法工程师
推荐系统:参与趣头条app信息流推荐系统的建设,负责召回策略、粗排、精排模块相关模型的构建与优化。 智能问答:负责智能问答系统中多个NLP相关模型的设计、开发、搭建。 文本分类:负责智能文本分类系统中,模型的训练、评估、部署。 智能营销:构建出包系统,进行特征加工,构建与训练机器学习模型,探索 PU 学习的应用,针对POC项目,进行模型优化;
教育经历
2016-09-01 - 2019-06-01西安科技大学会计学硕士
研究方向为数据挖掘与能源经济,主要做机器学习,启发式算法方向的应用
技能
项目背景:针对某产品的用户进行NPS调研,获取用户对某产品的使用评价,为了更好的优化产品,对用户的评价进行分类,从用户的评价中提取出用户描述所涉及的功能,对应的问题。 主要职责:(1)进行原始数据的清洗与加工;(2)负责大模型的微调工作,主要负责Chatglm2模型的微调,微调方式为p-tuning-v2。(3)使用微调后的模型,进行文本分预测,并将模型的结果与文心模型的结果进行对比分析; 主要成果:完成基于chatglm2微调模型的训练,针对原始的数据进行标签提取,提取准确率高达92%,且由于文心模型; 主要技术栈:chatglm2、ptuning-v2等。
项目背景:针对广东某医院 app,开发智能问诊模块,对用户输入进行分析和判断,初步判断用户患病情况,并给出就医指南。 主要职责:负责开发 NLP模块的相关模型,并进行模型训练和部署。包括:(1)命名实体识别模型(LSTM+CRF):主要用于识别句子中包含的实体,如:病名、症状词汇等;(2)命名实体判别模型(Bert+TextCNN):用于检查病名和症状词汇,是否为真正的实体,若是,将其保存至图数据库;若不是,则进行舍弃;(3)句子主题一致性判别模型(Bert+BiLstm):用于识别用户输入的话语,判断前后两句是否围绕同一主题进行;(4)模型部署:基于容器(docker)技术,利用 Flask 框架,对模型进行封装,对外提供接口; 主要成果:开发的 NLP 相关模型,其准确率均在 90%以上,良好的支撑了模型项目开展。 主要技术栈:docker、redis、neo4j、NLP、Flask
项目背景:趣头条 app 信息流推荐系统,由腾讯承接,包括图文信息推荐、视频信息推荐,我方提供推荐接口,客户请求接口,我方生产推荐信息,并进行反馈。 主要职责:(1)负责图文推荐过程中,粗排、精排模块的模型开发、部署、优化,包括 DSSM 模型,MMoE 模型;(2)负责推荐效果的监控与分析,根据分析结果,对推荐系统召回模型进行优化,增加或者调整召回策略,如热门召回、协同过滤、基于物品相似度的实时召回、基于用户相似度的召回等; (3)配合工程端同学,进行推荐系统 saas 化建设。 主要成果:(1)完成了图文推荐过程中粗排、精排模块的推荐模型的开发与优化,模型总体 AUC提升 2%;(2)对召回模块进行分析,增加多路召回,丰富召回结果。 主要技术栈:redis、kafka、推荐算法、hive、docker