数据处理工作:模型数据输入为30首古筝名曲的midi音乐,选取了最主要用的音轨,然后将单音符的音调与和弦提取出来,转化为字符串,并返回用整数表示的每个音调的正常顺序。将字符串列表去重后,建立了Python字典,以此每段音乐都用字符串对应的数字表示;模型设计工作:从球形高斯分布中采样随机向量z,并通过一系列转置卷积操作,以向上采样并生成输出数据x=G(z),该数据被输入向下采样卷积(其网络结构和生成器对称)的鉴别器网络D,以评估真实分布和生成的分布之间的发散程度,在GPU上训练实现了一个生成式的模型G,为每个音符高效的生成音频旋律。模型输入为一段时间的音符,目标输出为下一个时间步的音符;模型训练工作:模型一共训练了100轮,为了使得网络产生的音乐能达到“以假乱真”的效果,在模型结构不变的情况下,分别取lr、momentu和alpha不同的值对模型进行训练,当训练轮次增加到500,批量增加到20时模型达到收敛的效果。声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论