强化学习（DQN）教程REINFORCEMENT LEARNING (DQN) TUTORIAL

时间 2021-01-02

原文原文链接

本教程显示了如何使用PyTorch在OpenAI Gym的CartPole-v0任务上训练深度Q学习（DQN）agent。 agent必须在两个动作之间做出决定-向左或向右移动推车-以便使与之相连的电线杆保持直立。您可以在Gym网站上找到具有各种算法和可视化效果的官方排行榜。 cartpole 当代理观察环境的当前状态并选择一个动作时，环境会转换为新状态，并返回指示该动作后果的奖励。在此

>>阅读原文<<