changcc
1月前来过
全职 · 1000/日  ·  21750/月
工作时间: 周末09:00-21:00工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

大厂2年算法开发经历


工作经历

  • 2020-08-01 -2021-08-01百度算法

    实体消歧工作,[padding][padding][padding][padding][padding][padding][padding][padding]

教育经历

  • 2019-09-01 - 2022-01-01北航软件工程硕士

  • 2015-09-01 - 2019-07-01山东大学软件工程本科

技能

自然语言处理
0
1
2
3
4
5
作品
XXX摘要总结(公司相关,暂不完整展示)

基于LLM的摘要总结服务,为客户端定制化推送XX内容。 模型侧工作: 1. 数据集构建,continue pretrain dataset sft dataset rlhf dataset 2. 模型选择,使用few-prompt few-Cot对比了Llama-13B、ChatGLM2-6B,baichuan-13B等模型。 3.模型优化:10Bcontinue pretrain 多阶段sft RLHF 4.模型部署:量化 算法服务端: 1. python侧定时任务推送XX内容

0
2023-08-06 14:46
多模态文本分类(20年4月~5月)

DF的一个多模态文本分类比赛https://www.datafountain.cn/competitions/423/teams?view=all 最终成绩 Top0.5% A榜34/2049,B榜10/2049 比赛过程: 1.EDA分析训练数据 -> 数据重采样 -> 微调bert,添加FGM扰动,多任务学习->半监督学习,数据扩增->指标优化->分析bad case,对训练数据进行数据清洗,特征选择->利用stacking和voting进行模型融合,提分4个百分点。

0
2023-08-06 14:38
口语练习多轮对话(21年6月~11月)

为不同年龄段的学生提供非母语的口语练习服务,主要工作涉及: 1. 算法侧工作: 1.1 数据集构建(CET-4、CET-6场对话数据 可可英语情景对话 Mutual数据),共10W的训练集 1W验证集 1W测试集。 1.2 模型改进:添加词注意力 主题词引导 的生成式模型RecoSa,基于词向量的检索式模型DSP。(Bleu-4有0.56的提升 7.09 -> 7.65) 1.3 模型云端部署。 2. 安卓端搭建: 2.1 前端设计 2.2 后端交互 ASR TTS

0
2023-08-06 14:19
更新于: 2023-08-06 浏览: 79