EnCodec 基于深度学习的音频编解码器开源项目

我要开发同款
匿名用户2022年11月07日
60阅读
开发技术Python
所属分类应用工具、多媒体工具
授权协议CC-BY-NC 4.0

作品详情

EnCodec是一个基于深度学习的音频编解码器,由AI驱动,可以在音频质量没有损失的前提下,将音频压缩到比MP3格式还要小10倍的程度。

实现过程如下:

首先,编码器将未压缩的数据转换为较低帧率的"latentspace"表示(representation);然后,量化器将这个表示压缩到目标大小,同时跟踪最重要的信息,这些信息以后将被用于重建原始信号(这个压缩信号将通过网络发送或保存在磁盘上);最后,解码器使用单个CPU上的神经网络将压缩的数据实时地转变回音频;安装

EnCodec需要Python3.8和PyTorch1.11.0,要安装EnCodec,可以运行:

pipinstall-Uencodec#stablereleasepipinstall-Ugit+https://git@github.com/facebookresearch/encodec#egg=encodec#bleedingedge#ofifyouclonedtherepolocallypipinstall.使用

然后,可以使用EnCodec命令:

python3-mencodec[...]#orencodec[...] 
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论