怒风舞者
1天前在线
全职 · 800/日  ·  17400/月
工作时间: 周末9:30-6:30工作地点: 远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

十多年ai语音合成技术行业经验,擅长ai模型开发调优,语音数据制作和处理,擅长python和pytorch框架,熟悉拼接,参数,dnn,tacotron,vits,valle等各代语音合成框架和原理推导;熟悉自然语言处理技术,比如中文分词,词性标注,句法分析,韵律预测等技术;熟悉统计机器学习方法和深度学习的理论和应用;熟悉大模型prompt工程,多agents开发等大模型应用开发;可承接语音合成、自然语言处理、大模型应用开发等。

工作经历

  • 2018-12-01 -2022-02-01字节跳动语音合成科学家

    参与语音合成技术的开发应用落地,包括多语言多场景多角色多风格的技术研发,最终用于诸如抖音,番茄小说等产品。期间对tacotron2技术进行了中英文适配,部分模块创新,达到高可控的目标。

教育经历

  • 2007-09-01 - 2010-07-01社科院研究生院语言学及应用语言学硕士

    系统学习了实验语音学,主要做中文普通话韵律相关的声乐分析,接触到了参数语音合成,此后一直在该技术上跟进。

  • 2003-09-01 - 2007-06-01北京大学语言学及应用语言学本科

    系统学习了计算语言学,数学,计算机三门学科的主要课程,并在大三开始接触学习了机器学习与人工智能课程。对数学建模感兴趣。

技能

深度学习
机器学习
语音识别
自然语言处理
Torch
0
1
2
3
4
5
0
1
2
3
4
5
作品
中文分词和词性标注模型

模型功能:对输入中文句子进行分词,并对分词结果进行词性标注; 系统架构:基于有向无环图+条件随机场模型的分词+词性标注端到端模型,基于python开发。 使用方法:可以基于已经训练好的模型去做分词和词性标注; 主要职责:负责新模型架构的构思,模型推理、参数优化的数学推导,并采用python实现。 主要成果:基础模型基于北大98年人民日报语料库训练,在22年人民日报数据集上分词准确率可达98.3%,词性标注准确率也在94%以上;支持快速新增数据学习、热更新,线上badcase热修复。

0
2024-12-12 21:17
更新于: 12-11 浏览: 11