changcc-北京人工智能-程序员客栈

21小时前在线

D级

算法

北京

全职 · 1000/日 · 21750/月信用正常

工作时间: 周末09:00-21:00工作地点: 远程

服务企业: 1家累计提交: 0工时

联系方式:

********

查看联系方式

聊一聊

使用APP扫码聊一聊

去下载APP

个人主页

大厂2年算法开发经历

2020-08-01 -2021-08-01百度算法
实体消歧工作，[padding][padding][padding][padding][padding][padding][padding][padding]

2019-09-01 - 2022-01-01北航软件工程硕士
2015-09-01 - 2019-07-01山东大学软件工程本科

自然语言处理

作品

XXX摘要总结（公司相关，暂不完整展示）

基于LLM的摘要总结服务，为客户端定制化推送XX内容。模型侧工作： 1. 数据集构建，continue pretrain dataset sft dataset rlhf dataset 2. 模型选择，使用few-prompt few-Cot对比了Llama-13B、ChatGLM2-6B，baichuan-13B等模型。 3.模型优化：10Bcontinue pretrain 多阶段sft RLHF 4.模型部署：量化算法服务端： 1. python侧定时任务推送XX内容

2023-08-06 14:46

多模态文本分类（20年4月~5月）

DF的一个多模态文本分类比赛https://www.datafountain.cn/competitions/423/teams?view=all 最终成绩 Top0.5% A榜34/2049，B榜10/2049 比赛过程： 1.EDA分析训练数据 -> 数据重采样 -> 微调bert，添加FGM扰动，多任务学习->半监督学习，数据扩增->指标优化->分析bad case，对训练数据进行数据清洗，特征选择->利用stacking和voting进行模型融合，提分4个百分点。

2023-08-06 14:38

口语练习多轮对话（21年6月～11月）

为不同年龄段的学生提供非母语的口语练习服务，主要工作涉及： 1. 算法侧工作： 1.1 数据集构建（CET-4、CET-6场对话数据可可英语情景对话 Mutual数据），共10W的训练集 1W验证集 1W测试集。 1.2 模型改进：添加词注意力主题词引导的生成式模型RecoSa，基于词向量的检索式模型DSP。（Bleu-4有0.56的提升 7.09 -> 7.65） 1.3 模型云端部署。 2. 安卓端搭建： 2.1 前端设计 2.2 后端交互 ASR TTS

2023-08-06 14:19

更新于: 2023-08-06 浏览: 110

个人介绍

工作经历

教育经历

技能

相似推荐换一批

重点城市程序员兼职推荐

重点岗位程序员兼职推荐