MindSporeReinforcement是一个开源的强化学习框架,支持使用强化学习算法对agent进行分布式训练。MindSporeReinforcement为编写强化学习算法提供了干净整洁的API抽象,它将算法与部署和执行注意事项解耦,包括加速器的使用、并行度和跨worker集群计算的分布。MindSporeReinforcement将强化学习算法转换为一系列编译后的计算图,然后由MindSpore框架在CPU、GPU或AscendAI处理器上高效运行。
架构:
MindSporeReinforcement是一个开源的强化学习框架,支持使用强化学习算法对agent进行分布式训练。MindSporeReinforcement为编写强化学习算法提供了干净整洁的API抽象,它将算法与部署和执行注意事项解耦,包括加速器的使用、并行度和跨worker集群计算的分布。MindSporeReinforcement将强化学习算法转换为一系列编译后的计算图,然后由MindSpore框架在CPU、GPU或AscendAI处理器上高效运行。
架构:
评论