强化学习(DQN)教程REINFORCEMENT LEARNING (DQN) TUTORIAL

本教程显示了如何使用PyTorch在OpenAI Gym的CartPole-v0任务上训练深度Q学习(DQN)agent。 agent必须在两个动作之间做出决定-向左或向右移动推车-以便使与之相连的电线杆保持直立。您可以在Gym网站上找到具有各种算法和可视化效果的官方排行榜 。     cartpole 当代理观察环境的当前状态并选择一个动作时,环境会转换为新状态,并返回指示该动作后果的奖励。在此
相关文章
相关标签/搜索