钢琴分类模型_开源AI项目-程序员客栈

本研究基于深度学习技术，借鉴了计算机视觉领域的经典骨干网络结构，通过音频数据处理构建了一种创新的8分类钢琴音质判别器模型。该模型以Kawai、Kawai Grand、YOUNG CHANG、HSINGHAI、Steinway Theatre、Steinway Grand、Pearl River和Yamaha等8个品牌和类型的钢琴为研究对象。通过将音频数据转换为Mel频谱并在微调阶段进行监督学习，模型能够准确地区分不同钢琴音质，并在实际测试中表现出色。在训练过程中，我们使用了大规模标注的音频数据集，通过逐步学习从音频中提取关键特征，深度学习技术的引入为模型的性能提升提供了关键支持。该音质判别器模型在音乐评估、音响工程等领域中具有广泛应用潜力，为钢琴音质判别提供了一种先进而可靠的解决方案。这一研究为深度学习在音频领域的应用拓展了新的可能性，为未来相关领域的研究和应用提供了有益的参考。

在线体验

https://www.modelscope.cn/studios/ccmusic-database/pianos

使用

from modelscope import snapshot_download
model_dir = snapshot_download('ccmusic-database/pianos')

维护

GIT_LFS_SKIP_SMUDGE=1 git clone https://www.modelscope.cn/ccmusic-database/pianos.git
cd pianos

训练结果

Loss curve
Training and validation accuracy
Confusion matrix

数据集

https://www.modelscope.cn/datasets/ccmusic-database/pianos

镜像

https://huggingface.co/ccmusic-database/pianos

评估

https://github.com/monetjoe/Piano-Classification

引用

@inproceedings{DBLP:journals/corr/abs-2310-04722,
  author    = {Monan Zhou and
               Shangda Wu and
               Shaohua Ji and
               Zijin Li and
               Wei Li},
  title     = {A Holistic Evaluation of Piano Sound Quality},
  booktitle = {Proceedings of the 10th Conference on Sound and Music Technology (CSMT)},
  year      = {2023},
  publisher = {Springer Singapore},
  address   = {Singapore},
  timestamp = {Fri, 20 Oct 2023 12:04:38 +0200},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

钢琴分类模型

作品详情

在线体验

使用

维护

训练结果

数据集

镜像

评估

引用

重点城市程序员兼职推荐

重点岗位程序员兼职推荐