DeepSpeed 基于 PyTorch 的深度学习优化库开源项目

我要开发同款
匿名用户2020年02月11日
31阅读
开发技术Python
所属分类人工智能、机器学习/深度学习
授权协议MIT

作品详情

DeepSpeed是一个深度学习优化库,它可以使分布式训练变得容易、高效和有效。

10x更大的模型5x更快地训练最小的代码更改

DeepSpeed可以在当前一代的GPU集群上训练具有超过千亿个参数的DL模型,而与最新技术相比,其系统性能可以提高5倍以上。DeepSpeed的早期采用者已经生产出一种语言模型(LM, LanguageModel),它具有超过170亿个参数,称为Turing-NLG(TuringNaturalLanguageGeneration,图灵自然语言生成),成为LM类别中的新 SOTA。 

DeepSpeedAPI是在PyTorch上进行的轻量级封装,这意味着开发者可以使用 PyTorch中的一切,而无需学习新平台。此外,DeepSpeed管理着所有样板化的SOTA训练技术,例如分布式训练、混合精度、梯度累积和检查点,开发者可以专注于模型开发。同时,开发者仅需对PyTorch模型进行几行代码的更改,就可以利用DeepSpeed独特的效率和效益优势来提高速度和规模。

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论