PyTorch 强化学习 01.强化学习(DQN)

本教程介绍如何使用PyTorch从OpenAI Gym中的 CartPole-v0 任务上训练一个Deep Q Learning (DQN) 代理。 1.任务 代理人必须在两个动作之间做出决定 – 向左或向右移动推车 – 以使连接到它的杆保持直立。您可以在Gym 网站上找到官方排行榜,里面包含各种算法以及可视化。     当代理观察环境的当前状态并选择动作时,环境转换到新状态,并且还返回指示动作的
相关文章
相关标签/搜索