个人介绍
我是程序员客栈的Cmpltrtok,一名AI算法工程师;
我毕业于中国地址大学,担任过某软件公司的AI算法工程师。
负责过NLP、CV、大模型的项目的开发;
熟练使用PyTorch,Hugging Face,Python,OpenCV,等技术;
如果我能帮上您的忙,请点击“立即预约”或“发布需求”!
工作经历
2023-08-01 -2024-03-31北京市海淀区八维计算机培训学校NLP大模型实训项目经理已认证
2023年8月至2024年3月我就职于八维教育集团北京人工智能学院,任NLP大模型实训项目经理,负责该学院NLP大模型实训。实训内容主要有: 以Qwen-1_8B-Chat为例,进行跟踪调试(推理模式+训练模式),使学生对transformer的运行机制有深刻理解,对KV Cache的实现有直观认识。 对PyTorch分布式模型训练和Hugging Face模型训练进行用法讲解、源码跟踪调试、功能定制。 对开源项目FastChat和Langchain-Chatchat做了源码分析、跟踪调试、逆向工程。以Langchain-Chatchat为样板讲解了Langchain、RAG、Agent、基于搜索引擎的LLM对话、基于用户上传文件的LLM对话。 带领学生对Qwen 1.8B和ChatGLM2-6B进行LoRA和p-tuning v2微调。讲解了在Hugging Face里面使用DeepSpeed的方法以及DeepSpeed的方法以及DeepSpeed的原理。 讲解并实践Docker的一般操作和Dockerfile的编写方法。 为已就业学生提供一年的技术支持,解决各种一线的实际问题。
2020-10-01 -2023-07-31北京电鲸科技有限公司AI算法工程师
2022年底开始,由于ChatGPT的爆火,我负责开发 “数字人Core” 项目。这是实现虚拟主播的核心部件。用户语音输入转文本后,经ChatGPT得到输出文本,然后用TTS技术得到输出语音,驱动其他同事开发的数字人形象和用户互动。 开始是使用国外服务器作为跳板使用GPT3和OpenAI的微调接口,后来ChatGPT开放API后使用ChatGPT,后来使用国内开源大模型加微调作为替代。属于LLM Agent聊天机器人。除闲聊对话外,还有情绪分析(分析虚拟主播的情绪用于驱动数字人形象、分析用户的情绪用于更好的信息反馈)、意图识别(用户想让虚拟主播干什么、唱什么歌、跳什么舞、等等)、知识图谱(查询某歌手成名曲、查询某舞蹈在现有表演库里的版本、等等,作为LLM的配合)。我负责所有代码的开发,向技术副总汇报。 “数字人Core” 项目之前我负责该公司传统NLP算法工作,包括:文本分类(服务于评论分级、垃圾信息识别、直播间气氛评估)、NER命名实体识别(服务于提取用户兴趣和偏好、编制索引)、模型封装与部署、知识图谱构建与查询封装(Neo4J + Cypher)、等。
2015-11-01 -2020-08-31北京瑞友科技股份有限公司高级软件工程师已认证
2015年11月至2020年9月我就职于北京瑞友科技股份有限公司,任高级软件工程师,服务于TKE项目。TKE是德国某知名电梯公司。TKE项目负责TKE在全球40多个国家和地区的在线管理系统VIEW。我的主要工作是新需求开发(Change Request)、Bug Fix、用户文档和技术文档的撰写、和客户对接、等。 这是国际项目,锻炼了我的英语能力。我通过了PETS 3级(笔试+听力+口语),熟练阅读各种英文论文、文档、博客,熟练用英文写项目文档和代码注释,可用英语开会讨论项目。
2009-03-01 -2015-10-31北京金叶天盛科技有限公司高级软件工程师、Team Leader
2009年3月至2015年10月 我就职于北京金叶天盛科技有限公司,任高级软件工程师、Team Leader。其间我的工作大致分为3块: 1. 其网站“医脉通”的开发维护。 2. 为公司实践了一条用HTML5+JS开发App,再用Phonegap打包成IOS和Android应用的道路。作为Team Leader主导了许多类似项目的开发。 3. 通过短信网关,为公司开发实时短信接收、批量短信定制发送、会议大屏幕系统。 这些项目培养了我作为程序员的素养、锻炼了我的开发能力、拓宽了我的视野,对于我日后的技术能力有重要贡献。
教育经历
2022-09-01 - 2026-07-01菏泽学院生物学教育专科已认证
2014-09-01 - 2018-01-10中国地质大学(北京)土木工程本科已认证