David_2019
1月前来过
全职 · 2000/日  ·  43500/月
工作时间: 工作日09:00-06:00、周末09:00-18:00工作地点: 上海远程
服务企业: 0家累计提交: 0工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

13年语音研发经验,目前资深工程师:

1,百度地图说话人音色合成作者之一

2,GPT TTS大模型,大模型语音克隆技术,ChatGPT LLM大模型核心技术,Dall-E 大模型图像生成

3,基于fastspeech,tacotron,VAE,VITS,StyleTTS,MegaTTS2的单人,多人语音合成;音色迁移,情感迁移,音色转换,音色克隆

4,基于HTK,Kaldi,wenet,espnet的语音识别

5,语音合成,语音识别,语音唤醒,声纹识别,情感识别,性别识别,年龄识别


口号:没有搞不定的事情,只有付不起的钱

工作经历

  • 2016-01-01 -2019-01-01百度高级算法工程师

    1,百度地图说话人音色合成 2,基于fastspeech,tacotron,VAE,VITS,StyleTTS,MegaTTS2的单人,多人语音合成;音色迁移,情感迁移,音色转换,音色克隆 3,基于HTK,Kaldi,wenet,espnet的语音识别 4,语音唤醒,声纹识别,情感识别,性别识别,年龄识别

教育经历

  • 2011-09-01 - 2014-09-01北京理工大学计算机科学与技术硕士

技能

语音合成
语音唤醒
语音识别
0
1
2
3
4
5
0
1
2
3
4
5
作品
语音产品3

1,百度地图说话人音色合成 2,基于fastspeech,tacotron,VAE,VITS的单人,多人语音合成;音色迁移,情感迁移,音色转换,音色克隆 3,基于HTK,Kaldi,wenet,espnet的语音识别 4,语音唤醒,声纹识别,情感识别,性别识别,年龄识别

0
2023-03-31 22:52
语音产品2

1,百度地图说话人音色合成 2,基于fastspeech,tacotron,VAE,VITS的单人,多人语音合成;音色迁移,情感迁移,音色转换,音色克隆 3,基于HTK,Kaldi,wenet,espnet的语音识别 4,语音唤醒,声纹识别,情感识别,性别识别,年龄识别

0
2023-03-31 22:53
语音产品1

1,百度地图说话人音色合成 2,基于fastspeech,tacotron,VAE,VITS的单人,多人语音合成;音色迁移,情感迁移,音色转换,音色克隆 3,基于HTK,Kaldi,wenet,espnet的语音识别 4,语音唤醒,声纹识别,情感识别,性别识别,年龄识别

0
2023-03-31 22:58
更新于: 03-06 浏览: 254