使用Dagger iterations进行模仿学习和行为克隆学习;利用mujoco物理引擎进行复杂环境下的物理模拟实验;在Gym AI环境 中进行API参考和开发,并采用TensorFlow和Numpy进行深度学习相关的计算.
评论