Nevermore
59分钟前在线
全职 · 1000/日  ·  21750/月
工作时间: 工作日20:30-00:00、周末10:00-23:00工作地点:
服务企业: 1家累计提交: 1工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

本人目前在国内某大厂大语言模型核心研发团队,熟练掌握大语言模型 Pre-train、Post-train、 模型部署等关键技术,日常进行百卡/千卡级模型训练,具有十分丰富的实践经验。

本人对大模型技术有很强的热情,工作非常认真,与同事合作非常融洽。同时,对远程工作模式十分熟悉,可以很好协调工作。

本人目前只接兼职需求,周末时间充裕。

工作经历

  • 2023-11-01 -至今某大厂大模型研究员

    在一线基座模型核心研发团队中,深入参与大模型研发各流程,尤其深入参与各尺寸模型预训练、SFT 以及数据清洗配比等工作。 负责关键模型生产,监控模型评估指标。探索新一代模型结构,对大语言模型结构具有深刻理解。

  • 2021-02-22 -2023-11-01粤港澳大湾区数字经济研究院算法工程师

    主要负责基于深度学习算法构建全科医学知识图谱,期望落地辅助医疗决策CDSS、医学NLP技术、知识推理等场景。 本人是项目主要负责人,负责医学实体发现NER算法、术语聚合算法、关系抽取等算法的实现和优化,并协调工程团队完成线上发版。

  • 2018-07-01 -2021-02-19商汤科技全栈工程师

    1/ 大规模十万路级人像识别应用系统。参与分布式人像聚类组件开发,负责人像搜索组件开发。 2/ 轨道交通智慧通行系统。负责无感同行系统开发。

教育经历

  • 2015-09-01 - 2018-06-01中国科学院大学软件工程硕士研究生

    在中科院计算所就读软件工程专业,获得良好的软件开发锻炼。

  • 2011-09-01 - 2015-06-01中国科学技术大学物理学本科

    在中科大就读物理学专业,获得中科大优秀毕业生称号。数理基础扎实,学习能力强。

技能

深度学习
自然语言处理
0
1
2
3
4
5
0
1
2
3
4
5
作品
地铁刷脸出行项目

该系统是地铁刷脸进站系统,用户在 APP 注册后可以使用刷脸过闸机。用户注册后会将其人脸特征存入 注册库和模板库,刷脸搜索会从模板库里搜,并更新模板库。系统还支持戴口罩搜索功能。 本人参与后端开发。负责接口设计、核心代码编写、实现用户特征注册、用户图片注册、特征搜索、图片搜 索、模板库更新等核心功能。目前已经在哈尔滨、太原、西安、郑州等多个城市上线运行。

0
2023-04-24 06:45
大规模人脸识别应用

本项目是一个安防项目,解决城市级每天亿级规模的人脸抓拍图片的聚类和检索问题。 在该项目中,本人参与亿级规模聚类问题的算法实现和优化,包括算法侧的聚类收敛、聚类效果评估,同时参与解决工程侧的大数据下系统高可用问题。

0
2023-04-24 06:52
超大规模医学知识图谱构建

本项目目的基于深度学习算法构建全科医学知识图谱,期望落地辅助医疗决策CDSS、医学NLP技术、知识推理等场景。 本人是项目主要负责人,负责医学实体发现NER算法、术语聚合算法、关系抽取等算法的实现和优化,并协调工程团队完成线上发版。

0
2023-04-24 06:55
更新于: 10小时前 浏览: 253