个人介绍
我是程序员客栈的Zack,一名AI算法工程师;
我毕业于中国科学院大学,担任过浪潮的主任工程师、国家重点实验室研究员,担任过清华大学的计算机系博士后;
负责过《智慧城市大脑》、《中文旅游知识图谱》、《汽车知识图谱》等项目的开发;
熟练使用 大语言模型、RAG、GraphRAG、知识图谱、NLP;
如果我能榜上您的忙,请点击“立即预约”或“发布需求”!
工作经历
2022-10-01 -至今浪潮算法工程师
大模型领域研究:在 Huggingface 社区发布大语言模型,有大模型训练调优经验,GraphRAG 及对话机器人、绘 画机器人等项目实践;将大语言模型技术引入推荐系统研究,提交 3 篇关于大语言模型专利申请;解决图大模型技 术难点,研发自监督图神经网络预训练方法,实现图数据的有效挖掘和知识图谱的增强;
2020-09-01 -2022-10-01清华大学计算机系博士后
算法研究与应用:深入研究语义链接的多语言多模态知识图谱构建、大规模常识库的构建、表征、推理方法及开放平 台、深度学习与知识图谱融通的自然语言处理技术等;结合项目需求,应用相关算法和模型,如数据预处理算法、BERT、 两阶段式信息抽取 Pipeline、信息检索式问答模型、TravelBERT、三元组质量评估算法等; 算法工程化:将自然语言处理和知识图谱领域的研究成果,应用到企业和科研项目中,如《中文旅游知识图谱项目》《汽 车知识图谱项目》《大规模常识库的构建项目》;
教育经历
2017-09-01 - 2020-06-01中国科学院大学模式识别与智能系统博士
2014-09-01 - 2017-06-01中国科学院大学计算机科学与技术硕士
2010-09-01 - 2014-06-01山东大学自动化本科
技能
项目分为:向量知识库的构建模块、大模型对话模块,对使用者来说实现了PDF文档集合的智能分析 我负责前后端的开发、开源LLM的部署、向量数据库的解决方案,最终达到了PDF检索准确性提高20%,工作效率提升50%。 难点:将PDF切片并且检索相关部分、大模型部署和推理、向量数据库的使用
项目分为:脑科学知识抽取模块、知识图谱构建模块、知识查询和分析模块,对使用者来说实现了250万篇脑科学文献的智能分析 我负责关键部分的NLP、知识图谱算法的解决,最终达到了抽取了3000万条知识,准确率提升50%。 难点:从科学文献中抽取出结构化的知识、领域大模型的训练