个人介绍
2017年毕业,主要从事对话系统、大模型应用算法、Agent等领域算法的研发工作。
曾在金融智能客服、小爱同学主动式对话、智能座舱、ChatBI等多个领域做到业界领先水平。
在大模型应用算法方向,主要擅长RAG、SFT和推理加速等,在基于大模型的多轮对话、Text2SQL等领域达到了SOTA。
截止至2024年6月,本人已为50余家企业或高校提供相关技术服务,主要涉及基于RAG的智能问答系统和ChatBI等业务场景,
落地的场景主要包括智慧政务、金融智能客服、金融数据分析、智慧医疗、智慧教育等多个应用场景。
工作经历
2022-06-27 -至今吉利资深自然语言处理算法工程师
公司主要负责吉利旗下的智能助理研发和智慧建议项目研发工作。其中智能助理主要覆盖吉利旗下的智能汽车,魅族的手机和星际时代研发的XR眼镜。智慧建议是一个开发的事件驱动的智能推荐平台,支持对多设备进行适配,能兼容基于事件感知的信息推送(如小爱建议)和对话系统中的主动式对话,功能引导和多轮引导等多个业务线。 本人主要智能助理整体架构以及多轮交互协议等多个子模块的设计,中控仲裁模型的优化,支持多端适配的端云协同的智慧建议架构设计与实现。
2018-10-15 -2022-05-31小米自然语言处理算法工程师
部门主要负责小爱同学语音助手的研发,主要覆盖了小米相关的智能设备,如手机,智能音箱,电视和小爱Lite等。支持了天气,导航,IOT控制,音乐等1000多个功能。本人主要负责了多个垂域的语义理解,垂域的多轮对话,以及主动式对话系统的设计与开发,落地了业界前沿的推荐方案。
2016-10-20 -2018-09-30同花顺自然语言处理算法工程师
部分主要负责财经领域智能客服系统的研发,To B的智能外呼系统研发,以及NLP算法相关的Open API研发。智能客服主要涉及到财经领域的诊股,基金,选股等财经相关的16个子垂域的功能研发,智能外呼系统主要是针对券商的催收业务设计的智能对话系统。本人主要负责了垂域的语义理解,上下文语义补全,以及情感识别和场景识别等多个模块等研发工作,并将上下文理解模块接入了公司的Open API。
教育经历
2014-09-01 - 2017-06-30武汉科技大学计算机科学与技术硕士
硕士期间,主要从事迁移学习/深度学习相关研发,有2段自然语言处理/对话系统/语义理解方向的实习经验
2010-09-01 - 2014-06-30武汉科技大学计算机科学与技术本科
技能
【业务模块】 整体金融大模型行业调研报告项目主要分为三个部分,其中第一部分主要是待调研公司核心数据的 配置模块,主要包括三个类别下的数据信息,即:所属行业,推荐指标类别和核心指标类别等。第二 部分主要是对待调研公司的各类指标进行行业咨询内容的采集。第三部分是对于采集的信息做核心信 息抽取,完成整体摘要信息的生成。 【负责业务】 主要负责整体业务架构的算法架构设计,实现基于金融搜索大模型的信息采集和基于金融推理大模型的 调研报告生成。主要涉及到搜索大模型的应用,大模型微调和基于大模型的摘要生成等业务内容。 【效果】 整体完成了业务目标,实现了全自动的行业信息采集和摘要生成,极大地提高了行业调研报告生成的效率。
1、项目描述 为了提高对互联网海量源声中舆情的分析能力,本项目构建了一个社媒数据的热点挖掘与观点提取系统。系统的主要目标为: (1)对于海量互联网源声进行过滤,保留相关数据; (2)基于过滤结果,对源声进行事件抽取与编码,聚类形成业务热榜; (3)对于各业务热榜进行观点分类,得到热点事件的用户舆情。 2、主要工作 (1)根据任务特点,从零训练了中文GPT-4模型用于源声数据的事件生成,通过三个阶段分别训练模型的中文语言建模能力,通用摘要能力和针对任务的事件生成能力; (2)分别训练了用于领域过滤,观点分类的模型,引入Prompt Learning,对比学习等技术提升模型性能; (3)尝试使用中文大模型对热点事件模块进行优化,提升热榜准确率和可读性; (4)完成服务的工程代码开发,各功能模块解耦,满足业务方的实际使用场景,部署服务到MLOPs平台。 3、项目成果 (1)截至目前,文本过滤模块和观点分类模块准确率均达到90%以上; (2)舆论热榜模块聚类簇准确率达到87%,相较于原服务准确率提升20%; (3)服务交付相关业务使用。 4、个人收获 (1)深度参与构建真实场景下的NLP应用系统,完整地进行了"数据准备-模型构建-训练调优-工程开发-测试验收服务上线"的过程; (2)通过本项目,对预训练语言模型的应用能力和不同任务的综合能力得到进一步锻炼;对企业中的模型开发流程和工具平台有一定了解。
项目背景:针对某医院智能问诊系统,开发智能问诊模块,对用户输入进行分析和判断,初步判断用户患病情况,并给出就医指南。 主要职责:负责对话引擎整体的算法设计,并进行相关大模型的微调和服务部署。其中涉及的子任务主要包括: (1). 针对用户输入信息的语义理解,抽取核心信息字段信息,主要包括病症名称词汇和病情描述信息。(2). 利用RAG技术实现对问诊流程的智能问答,包括看病流程,报销流程等等。(3). 针对用户的疾病信息进行问诊引导,包括去哪个科室,处理的流程和注意事项等等。(4).信息智能查询,通过语音查询检测结果信息等功能。 主要成果:完成整体系统的开发和大模型的微调,系统对话整体的准确率达到90%以上。