钢琴分类模型

我要开发同款
匿名用户2024年07月31日
11阅读
开发技术Pytorch
所属分类ai
开源地址https://modelscope.cn/models/ccmusic-database/pianos
授权协议MIT License

作品详情

本研究基于深度学习技术,借鉴了计算机视觉领域的经典骨干网络结构,通过音频数据处理构建了一种创新的8分类钢琴音质判别器模型。该模型以Kawai、Kawai Grand、YOUNG CHANG、HSINGHAI、Steinway Theatre、Steinway Grand、Pearl River和Yamaha等8个品牌和类型的钢琴为研究对象。通过将音频数据转换为Mel频谱并在微调阶段进行监督学习,模型能够准确地区分不同钢琴音质,并在实际测试中表现出色。在训练过程中,我们使用了大规模标注的音频数据集,通过逐步学习从音频中提取关键特征,深度学习技术的引入为模型的性能提升提供了关键支持。该音质判别器模型在音乐评估、音响工程等领域中具有广泛应用潜力,为钢琴音质判别提供了一种先进而可靠的解决方案。这一研究为深度学习在音频领域的应用拓展了新的可能性,为未来相关领域的研究和应用提供了有益的参考。

在线体验

https://www.modelscope.cn/studios/ccmusic-database/pianos

使用

from modelscope import snapshot_download
model_dir = snapshot_download('ccmusic-database/pianos')

维护

GIT_LFS_SKIP_SMUDGE=1 git clone https://www.modelscope.cn/ccmusic-database/pianos.git
cd pianos

训练结果

Loss curve
Training and validation accuracy
Confusion matrix

数据集

https://www.modelscope.cn/datasets/ccmusic-database/pianos

镜像

https://huggingface.co/ccmusic-database/pianos

评估

https://github.com/monetjoe/Piano-Classification

引用

@inproceedings{DBLP:journals/corr/abs-2310-04722,
  author    = {Monan Zhou and
               Shangda Wu and
               Shaohua Ji and
               Zijin Li and
               Wei Li},
  title     = {A Holistic Evaluation of Piano Sound Quality},
  booktitle = {Proceedings of the 10th Conference on Sound and Music Technology (CSMT)},
  year      = {2023},
  publisher = {Springer Singapore},
  address   = {Singapore},
  timestamp = {Fri, 20 Oct 2023 12:04:38 +0200},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论