本工作完成了基于OpenCL的卷积神经网络的并行设计,验证了所设计算法在异构并行平台上的可行性和正确性。 在分析手写数字识别的卷积神经网络基本结构的基础上,总结了基于OpenCL的卷积神经网络训练的优化方法,提出了单卷积过程并行、多卷积任务并行、多卷积数据 并行和批处理等基于openCL的并行优化程序,并完成优化程序编程。 CNN算法的训练、测试过程和仿真均在Intel CPU、AMD GPU和NVIDIA GPU平台上实现。 测试结果表明,在相同训练准确率的情况下,本文提出的并行优化方案比串行执行方法快约375倍。声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论