GiantMIDI-Piano 古典钢琴 MIDI 数据集开源项目

我要开发同款
匿名用户2021年12月17日
37阅读
开发技术Python
所属分类其他开源
授权协议CC BY 4.0

作品详情

GiantMIDI-Piano是一个古典钢琴MIDI数据集,包含2786位作曲家的10854个MIDI文件,作曲家姓氏的管理子集包含包含1787名作曲家的7236个MIDI文件,GiantMIDI-Piano是由字节跳动使用高分辨率钢琴转录系统从现场录音中转录而来的。

下载GiantMIDI钢琴方法一(推荐)按照disclaimer.md同意免责声明并下载GiantMIDI-Piano(193MB)的稳定版本。

方法二用户可以通过下载所有录音来获取GiantMIDI-Piano,然后按照本repo的其余部分将它们转录成MIDI文件。在单个GPU卡上转录需要大约200小时。

安装要求按照 https://pytorch.org/ 安装PyTorch(>=1.4) 。

上述链接还包括一个精选的子集。精选子集限制YouTube标题必须包含作曲家姓氏。

pipinstall-rrequirements.txt下载录音使用以下脚本从YouTube下载录音。大约可以下载10,854个录音。可能有无法再下载的音频。

WORKSPACE="./workspace"mkdir-p$WORKSPACEcp"resources/full_music_pieces_youtube_similarity_pianosoloprob.csv"$WORKSPACE/"full_music_pieces_youtube_similarity_pianosoloprob.csv"#Downloadallmp3s.Userscouldsplitthedownloadingintopartstospeedupthedownloading.E.g.,python3dataset.pydownload_youtube_piano_solo--workspace=$WORKSPACE--begin_index=0--end_index=30000python3dataset.pydownload_youtube_piano_solo--workspace=$WORKSPACE--begin_index=30000--end_index=60000python3dataset.pydownload_youtube_piano_solo--workspace=$WORKSPACE--begin_index=60000--end_index=90000python3dataset.pydownload_youtube_piano_solo--workspace=$WORKSPACE--begin_index=90000--end_index=120000python3dataset.pydownload_youtube_piano_solo--workspace=$WORKSPACE--begin_index=12000--end_index=150000下载的mp3文件如下所示:

mp3s_piano_solo(10,854文件)├──Aaron,Michael,PianoCourse,V8WvKK-1b2c.mp3├──Aarons,AlfredE.,BrotherBill,Giet2Krl6Ww.mp3└──...将音频转录为MIDI文件#Transcribeallmp3stomidifiles.Userscouldsplitthetranscriptionintopartstospeedupthetranscription.E.g.,python3audios_to_midis.pytranscribe_piano--workspace=$WORKSPACE--mp3s_dir=$WORKSPACE"/mp3s_piano_solo"--midis_dir=$WORKSPACE"/midis"--begin_ind=0--end_index=30000python3audios_to_midis.pytranscribe_piano--workspace=$WORKSPACE--mp3s_dir=$WORKSPACE"/mp3s_piano_solo"--midis_dir=$WORKSPACE"/midis"--begin_ind=30000--end_index=60000python3audios_to_midis.pytranscribe_piano--workspace=$WORKSPACE--mp3s_dir=$WORKSPACE"/mp3s_piano_solo"--midis_dir=$WORKSPACE"/midis"--begin_ind=60000--end_index=90000python3audios_to_midis.pytranscribe_piano--workspace=$WORKSPACE--mp3s_dir=$WORKSPACE"/mp3s_piano_solo"--midis_dir=$WORKSPACE"/midis"--begin_ind=90000--end_index=120000python3audios_to_midis.pytranscribe_piano--workspace=$WORKSPACE--mp3s_dir=$WORKSPACE"/mp3s_piano_solo"--midis_dir=$WORKSPACE"/midis"--begin_ind=120000--end_index=150000转录的MIDI文件如下所示:

midis(10854个文件)├──Aaron,Michael,PianoCourse,V8WvKK-1b2c.mid├──Abel,Frederic,LolaPolka,SLNJF0uiqRw.mid└──...在单个GPU卡上转录所有录音可能需要大约10天的时间。

脚本的详细信息可以在脚本中查看

分析GiantMIDI-Piano的统计数据所有统计数据和数字可以通过以下方式复制:

./scripts/3_statistics.sh
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论