proginn0945211039
1月前来过
全职 · 800/日  ·  17400/月
工作时间: 工作日07:30-09:30、周末08:00-22:00工作地点: 远程
服务企业: 9家累计提交: 1工时
联系方式:
********
********
********
聊一聊

使用APP扫码聊一聊

个人介绍

我是程序员客栈的Sweet orange,一名C++开发者; 我毕业于中国科学院大学,担任过百度的C++开发工程师,; 负责过【语音合成在线架构】,【个性化琴鸟】,【autovc微服务】的开发; 熟练使用【C++】,【redis】,【brcp】; 如果我能帮上您的忙,请点击“立即预约”或“发布需求”!

工作经历

  • 2018-07-07 -2022-09-15百度C++开发

    语音合成架构开发,高并发系统设计,基于 baidu-rpc 进行线上服务架构搭建、项目功能开发、算法实现、线上服务维护 语音合成引擎内核维护,前端文本模块、后端声学模块,声码器功能开发,性能调优,多平台下接口设计 一次唤醒多次交互现有架构的维护和新功能的实现、结合声学和文本特征的综合结果优化、优化拒识策略、多次交互数据 管理等

教育经历

  • 2015-09-01 - 2018-07-01中国科学院大学信号与信息处理硕士

资质认证

技能

C++
0
1
2
3
4
5
作品
auto-vc服务开发

1、autovc是通过源发音人到目标发音人进行音色转换,使得目标发音人拥有声优级别的韵律等特点,满足变声场景需求,由 gate、node、vocoder 等模块构成。 2、本人负责 autovc-vocoder 微服务开发,由于 GPU 资源紧缺以及 vocoder 与模型不耦合,拆分 node和 vocoder 模块,从0到1进行 vocoder 服务架构搭建、功能开发,在可扩展性的角度上兼容常规 tts 在线引擎的 proto 协议,已落地。

0
2023-04-12 10:04
个性化明星音项目

1、个性化明星音项目,具体链路由明星录音到模型训练、模型打包,由业务方通过合成架构访问明星音服务,原路返回音频。 2、本人主要负责从0到1开发首款在线个性化明星音服务,使用 baidu-rpc 进行服务调用和网络接口层开发,以流式的方式进行 音频流式回调,集成声学模型和声码器、降噪等模块,进行 qps 评估以及上线容器配置,已落地。

0
2023-04-12 10:08
语音引擎在线全链路开发

1、语音流量入口(pv 20亿+),同客户端是 http 协议进行交互,主要模块包括 proxy 和 controller、tts 引擎、文本服务。内部模块是通过 rpc 协议来进行通信。架构层面(proxy + controller),主要功能是进行集群管理和导流,有一些还有一些缓存的逻辑,最近主要实现了包括本地缓存、内存级 lru 缓存,以及 redis 缓存的多级缓存策略,并且基于发音人做同集群下的发音人导流,由于复杂的缓存机制,会在时间纬度上进行打散进行操作。 语音合成服务业务层主要分为前端和后端,考虑到前后端服务资源使用不耦合,以及便于上线和维护方面的原因,把两个模 块拆分成两个服务各自维护,拆分后后端服务单机 qps 提升。前端部分主要负责文本服务架构维护,以及前端内核功能开发。 开发切句逻辑,裁剪链路,从组件和模块纬度优化加载、上线资源,单机 qps 提升,降低首包响应时间,提升上线效率。增加 长文本合成能力,以及内核重构,支持粤语、日语等多语种能力。后端部分主要是修复引擎 badcase和 bug,subrnn 工程代码 开发以及自动化上线,配置派生沙盒,开放平台和线上容器,规范和简化上线流程。 2、离线引擎主要是支持无网、弱网情况下的语音合成功能,包括前端文本模块,声学参数预测、声码器部分,以动态库的形式 在各平台编译,提供给 sdk 集成,在多个产品线间使用。 本人主要负责离线语音合成引擎的C++开发,在各个平台上(andorid、ios、linux等)编译提供离线 so 库支持,负责引擎前 端、声学参数预测、以及声码器各模块需求开发,采用流式的方式工业化业内第一款神经网络声码器,助力个性化项目入围百 度最高奖前十名。设计产品线间音库授权链路,重构、归一化多版本引擎架构,开发可插拔的唇动功能,为离线虚拟人项目奠 定基础。

0
2023-04-12 10:10
更新于: 2022-11-07 浏览: 248