GiantMIDI-Piano是一个古典钢琴MIDI数据集,包含2786位作曲家的10854个MIDI文件,作曲家姓氏的管理子集包含包含1787名作曲家的7236个MIDI文件,GiantMIDI-Piano是由字节跳动使用高分辨率钢琴转录系统从现场录音中转录而来的。
下载GiantMIDI钢琴方法一(推荐)按照disclaimer.md同意免责声明并下载GiantMIDI-Piano(193MB)的稳定版本。方法二用户可以通过下载所有录音来获取GiantMIDI-Piano,然后按照本repo的其余部分将它们转录成MIDI文件。在单个GPU卡上转录需要大约200小时。安装要求按照 https://pytorch.org/ 安装PyTorch(>=1.4) 。上述链接还包括一个精选的子集。精选子集限制YouTube标题必须包含作曲家姓氏。pipinstall-rrequirements.txt下载录音使用以下脚本从YouTube下载录音。大约可以下载10,854个录音。可能有无法再下载的音频。WORKSPACE="./workspace"mkdir-p$WORKSPACEcp"resources/full_music_pieces_youtube_similarity_pianosoloprob.csv"$WORKSPACE/"full_music_pieces_youtube_similarity_pianosoloprob.csv"#Downloadallmp3s.Userscouldsplitthedownloadingintopartstospeedupthedownloading.E.g.,python3dataset.pydownload_youtube_piano_solo--workspace=$WORKSPACE--begin_index=0--end_index=30000python3dataset.pydownload_youtube_piano_solo--workspace=$WORKSPACE--begin_index=30000--end_index=60000python3dataset.pydownload_youtube_piano_solo--workspace=$WORKSPACE--begin_index=60000--end_index=90000python3dataset.pydownload_youtube_piano_solo--workspace=$WORKSPACE--begin_index=90000--end_index=120000python3dataset.pydownload_youtube_piano_solo--workspace=$WORKSPACE--begin_index=12000--end_index=150000下载的mp3文件如下所示:mp3s_piano_solo(10,854文件)├──Aaron,Michael,PianoCourse,V8WvKK-1b2c.mp3├──Aarons,AlfredE.,BrotherBill,Giet2Krl6Ww.mp3└──...将音频转录为MIDI文件#Transcribeallmp3stomidifiles.Userscouldsplitthetranscriptionintopartstospeedupthetranscription.E.g.,python3audios_to_midis.pytranscribe_piano--workspace=$WORKSPACE--mp3s_dir=$WORKSPACE"/mp3s_piano_solo"--midis_dir=$WORKSPACE"/midis"--begin_ind=0--end_index=30000python3audios_to_midis.pytranscribe_piano--workspace=$WORKSPACE--mp3s_dir=$WORKSPACE"/mp3s_piano_solo"--midis_dir=$WORKSPACE"/midis"--begin_ind=30000--end_index=60000python3audios_to_midis.pytranscribe_piano--workspace=$WORKSPACE--mp3s_dir=$WORKSPACE"/mp3s_piano_solo"--midis_dir=$WORKSPACE"/midis"--begin_ind=60000--end_index=90000python3audios_to_midis.pytranscribe_piano--workspace=$WORKSPACE--mp3s_dir=$WORKSPACE"/mp3s_piano_solo"--midis_dir=$WORKSPACE"/midis"--begin_ind=90000--end_index=120000python3audios_to_midis.pytranscribe_piano--workspace=$WORKSPACE--mp3s_dir=$WORKSPACE"/mp3s_piano_solo"--midis_dir=$WORKSPACE"/midis"--begin_ind=120000--end_index=150000转录的MIDI文件如下所示:midis(10854个文件)├──Aaron,Michael,PianoCourse,V8WvKK-1b2c.mid├──Abel,Frederic,LolaPolka,SLNJF0uiqRw.mid└──...在单个GPU卡上转录所有录音可能需要大约10天的时间。脚本的详细信息可以在脚本中查看分析GiantMIDI-Piano的统计数据所有统计数据和数字可以通过以下方式复制:./scripts/3_statistics.sh点击空白处退出提示
评论