PyTorch 强化学习 01.强化学习（DQN）

时间 2021-01-02

标签 PyTorch 算法 python 深度学习 java 人工智能栏目 Python 繁體版

原文原文链接

本教程介绍如何使用PyTorch从OpenAI Gym中的 CartPole-v0 任务上训练一个Deep Q Learning (DQN) 代理。 1.任务代理人必须在两个动作之间做出决定 – 向左或向右移动推车 – 以使连接到它的杆保持直立。您可以在Gym 网站上找到官方排行榜，里面包含各种算法以及可视化。当代理观察环境的当前状态并选择动作时，环境转换到新状态，并且还返回指示动作的

>>阅读原文<<