个人介绍
13年语音研发经验,目前资深工程师:
1,百度地图说话人音色合成作者之一
2,GPT TTS大模型,大模型语音克隆技术,ChatGPT LLM大模型核心技术,Dall-E 大模型图像生成
3,基于fastspeech,tacotron,VAE,VITS,StyleTTS,MegaTTS2的单人,多人语音合成;音色迁移,情感迁移,音色转换,音色克隆
4,基于HTK,Kaldi,wenet,espnet的语音识别
5,语音合成,语音识别,语音唤醒,声纹识别,情感识别,性别识别,年龄识别
口号:没有搞不定的事情,只有付不起的钱
工作经历
2016-01-01 -2019-01-01百度高级算法工程师
1,百度地图说话人音色合成 2,基于fastspeech,tacotron,VAE,VITS,StyleTTS,MegaTTS2的单人,多人语音合成;音色迁移,情感迁移,音色转换,音色克隆 3,基于HTK,Kaldi,wenet,espnet的语音识别 4,语音唤醒,声纹识别,情感识别,性别识别,年龄识别
教育经历
2011-09-01 - 2014-09-01北京理工大学计算机科学与技术硕士
技能
1,百度地图说话人音色合成 2,基于fastspeech,tacotron,VAE,VITS的单人,多人语音合成;音色迁移,情感迁移,音色转换,音色克隆 3,基于HTK,Kaldi,wenet,espnet的语音识别 4,语音唤醒,声纹识别,情感识别,性别识别,年龄识别
1,百度地图说话人音色合成 2,基于fastspeech,tacotron,VAE,VITS的单人,多人语音合成;音色迁移,情感迁移,音色转换,音色克隆 3,基于HTK,Kaldi,wenet,espnet的语音识别 4,语音唤醒,声纹识别,情感识别,性别识别,年龄识别
相似推荐 换一批
高级运维开发
666元/天
前上海易果电子商务有限公司
技能:Python,Java,Vue,Linux,windows,DevOps
高级架构师
500元/天
上海赛可电子商务有限公司
技能:Java,Vue,Mybatis,springboot,CSS,Redis,Hadoop,ElasticSearch,solr,hbase,Maven,ldap,PHP,HTML5,jQuery,Linux,element-ui,Axure,astah
高级架构师
1000元/天
高伟达软件股份有限公司
技能:Java,JavaScript,SQL,sql性能调优,需求分析,JSP,html,HTML5,CSS,React Native
高级架构师
2000元/天
自由职业
技能:系统架构设计,Java,Spring(Spring、Spring MVC、Spring Cloud),Mongo,Vue