智能NLP音频识别

我要开发同款
Joe 沫尔  2022年03月31日
196阅读

作品详情

CNN+RNN+LSTM+Tflite+HMM+vViterbi
项目描述:首先我们先训练一个模型,开始检测器由声学模型CNN组成,接着是一个双向LSTM,在向前和向后方向上都有128个单元,接着是一个完全连接的sigmoid层,有88个输出,用于表示88个钢琴键中每个键的开始概率。接着我们会用tp-spr和hmm文件去match最终的结果,其中算法用到了viterbi,动态规划,朴素贝叶斯,隐形马尔科夫等算法,其中走谱以及识谱模式,我们使用的两种方案,对于计算处理速度比较快的机型我们使用的是tflite,对于那些机型相对较老,CPU计算相对较慢的机型我们使用的onset算法,后来也尝试了silvet,aubio,BBC,qm等同类型机器学习的算法,但是效果相对较差。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论