Adept是一种强化学习框架,旨在通过抽象化与深度强化学习相关的工程挑战来加速研究。熟练提供:多GPU训练使用自定义网络,代理和环境的模块化界面PyTorch的基线强化学习模型和算法内置张量板日志记录,模型保存,重新加载,评估和渲染经验证的超参数默认值这段代码是抢先体验,可能会遇到麻烦。接口可能会发生变化。我们很高兴接受反馈和贡献。性能〜3,000步/秒=12,000FPS(Atari)本地模式64位环境GeForce2080Ti锐龙2700x8核曾经在Doom比赛中获胜 (BenBell/Marv2in) 训练50MSteps/200M帧每集开始时最多可进行30次无操作在不同的SEED上进行评估,而不是在训练过的SEED上进行评估体系结构:FourConvs (F=32) ,然后是 LSTM(F=512)执行 python-madept.applocal--logdir~/local64_benchmark--eval-y--nb-step50e6--env<env-id>声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论