OpenAI Gym 强化学习算法工具包开源项目

我要开发同款
匿名用户2019年06月25日
116阅读

技术信息

开源地址
https://gitee.com/mirrors/openai-gym
授权协议
MIT

作品详情

OpeAIGym是一个用于开发和比较强化学习算法的工具包。

gym不对代理的结构做任何假设,并且与任何数值计算库兼容,例如TesorFlow或Theao。

有关OpeAIGym的白皮书,请访问https://arxiv.org/abs/1606.01540,这里有一个BibTeX条目,可以在出版物中引用它:

@misc{1606.01540,Author={GregBrockmaadVickiCheugadLudwigPetterssoadJoasScheideradJohSchulmaadJieTagadWojciechZaremba},Title={OpeAIGym},Year={2016},Eprit={arXiv:1606.01540},}Basics

强化学习有两个基本概念:环境(即外部世界)和代理(即你正在编写的算法)。代理向环境发送操作,环境回复观察和奖励(即分数)。

核心的gym界面是Ev,它是统一的环境界面。没有代理商界面。以下是应该了解的Ev方法:

reset(self)::重置环境的状态。返回观察。step(self,actio):一步一步进入环境。返回观察、奖励、完成、信息。reder(self,mode='huma'):渲染一帧环境。默认模式将执行人性化的操作,例如弹出窗口。安装

可以执行最小的安装:

gitcloehttps://github.com/opeai/gym.gitcdgympipistall-e.

可以直接从PyPI进行最小的打包版本安装:

pipistallgym

可以立即运行一些环境:

算法toy_textclassic_cotrol(需要pyglet来渲染)

建议首先使用这些环境,然后再安装其余环境的依赖项。

功能介绍

OpenAI Gym 是一个用于开发和比较强化学习算法的工具包。 gym 不对代理的结构做任何假设,并且与任何数值计算库兼容,例如 TensorFlow 或 Theano。 有关 OpenAI ...

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论