本研究基于深度学习技术,借鉴了计算机视觉领域的经典骨干网络结构,通过音频数据处理构建了一种创新的8分类钢琴音质判别器模型。该模型以Kawai、Kawai Grand、YOUNG CHANG、HSINGHAI、Steinway Theatre、Steinway Grand、Pearl River和Yamaha等8个品牌和类型的钢琴为研究对象。通过将音频数据转换为Mel频谱并在微调阶段进行监督学习,模型能够准确地区分不同钢琴音质,并在实际测试中表现出色。在训练过程中,我们使用了大规模标注的音频数据集,通过逐步学习从音频中提取关键特征,深度学习技术的引入为模型的性能提升提供了关键支持。该音质判别器模型在音乐评估、音响工程等领域中具有广泛应用潜力,为钢琴音质判别提供了一种先进而可靠的解决方案。这一研究为深度学习在音频领域的应用拓展了新的可能性,为未来相关领域的研究和应用提供了有益的参考。
在线体验
https://www.modelscope.cn/studios/ccmusic-database/pianos
使用
from modelscope import snapshot_download
model_dir = snapshot_download('ccmusic-database/pianos')
维护
GIT_LFS_SKIP_SMUDGE=1 git clone https://www.modelscope.cn/ccmusic-database/pianos.git
cd pianos
训练结果
Loss curve | |
---|---|
Training and validation accuracy | |
Confusion matrix |
数据集
https://www.modelscope.cn/datasets/ccmusic-database/pianos
镜像
https://huggingface.co/ccmusic-database/pianos
评估
https://github.com/monetjoe/Piano-Classification
引用
@inproceedings{DBLP:journals/corr/abs-2310-04722,
author = {Monan Zhou and
Shangda Wu and
Shaohua Ji and
Zijin Li and
Wei Li},
title = {A Holistic Evaluation of Piano Sound Quality},
booktitle = {Proceedings of the 10th Conference on Sound and Music Technology (CSMT)},
year = {2023},
publisher = {Springer Singapore},
address = {Singapore},
timestamp = {Fri, 20 Oct 2023 12:04:38 +0200},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
评论