Horovod TensorFlow 分布式深度学习框架开源项目

我要开发同款
匿名用户2017年10月24日
47阅读
开发技术C/C++
所属分类人工智能、机器学习/深度学习
授权协议Apache

作品详情

Horovod是Uber开源的针对 TensorFlow 的分布式深度学习框架,旨在使分布式深度学习更快速,更易于使用。

Horovod吸取了Facebook的 TrainingImageNetin1Hour(一小时训练ImageNet)论文与百度RingAllreduce的优点,为用户实现分布式训练提供帮助。该项目主要是想能够轻松采用单个GPUTensorFlow程序,同时也能更快地在多个GPU上成功地对其进行训练。使用Horovod我们可以不需要再去担心或学习很多东西,如tf.Server()、tf.ClusterSpec()、tf.train.SyncReplicasOptimizer()、tf.train.replicas_device_setter()等等。

除了易于使用,Horovod的速度也很快。下图为InceptionV3和ResNet-101TensorFlow模型在25GbETCP上使用不同数量的NVIDIAPascalGPU时,使用标准分布式TensorFlow和Horovod运行分布式训练工作每秒处理的图像数量对比。

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论