Google-Lyra Google 开源的语音编解码器开源项目

我要开发同款
匿名用户2021年08月17日
44阅读
开发技术C/C++
所属分类应用工具、多媒体工具
授权协议Apache-2.0

作品详情

Lyra 是一种高质量、低比特率的语音编解码器,即使在最慢的网络上也可以进行语音通信。为此,它应用了传统的编解码器技术,同时利用机器学习(ML)的进步和在数千小时数据上训练的模型来创建压缩和传输语音信号的新方法。

Lyra的架构分为两部分,编码器和解码器。当有人对着手机说话时,编码器会从他们的语音中捕捉独特的属性。这些语音属性,也称为特征,以40ms为单位提取,然后压缩并通过网络发送。解码器的工作是将这些特征转换回音频波形,以便通过电话听筒播放出来。将特征解码回波形的过程是通过生成模型(Generativemodels)处理的,生成模型是一种特殊类型的机器学习模型,非常适合从有限的特征中重新创建一个完整的音频波形。Lyra架构与传统的音频编解码器非常相似,几十年来,传统的音频编解码器已经构成了互联网通信的主干。这些传统的编解码器是基于数字信号处理(DSP)技术,而Lyra的关键优势来自于生成模型重建高质量语音信号的能力。

Lyra的代码是用C++所编写的,以提高速度、效率和互操作性,使用Bazel构建框架和GoogleTest框架进行彻底的单元测试,并基于Apache许可协议进行分发。

 
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论