AsynchronousAdvantageActor-Critic(A3C)forplayingSuperMarioBros是超级马里奥兄弟的A3C算法,用于训练代理玩超级马里奥兄弟。
它可以:
通过运行pythontrain.py来训练模型通过运行pythontest.py来测试已经过训练的模型样本示例:
要求:
python3.6gymcv2pytorchnumpyAsynchronousAdvantageActor-Critic(A3C)forplayingSuperMarioBros是超级马里奥兄弟的A3C算法,用于训练代理玩超级马里奥兄弟。
它可以:
通过运行pythontrain.py来训练模型通过运行pythontest.py来测试已经过训练的模型样本示例:
要求:
python3.6gymcv2pytorchnumpy
评论