强化学习超进化:经典问题 30 年后惊现闭式解;TensorFlow2 强化学习教程 GitHub 代码大公开

强化学习经典控制问题 30 年后惊现闭式解 MountainCar-v0 是 Andrew Moore 在 1990 年提出的控制问题,提出后受到强化学习界的广泛关注,并收录到强化学习影响力最大的环境库之一 Gym 中,成为大多数强化学习教程中必用的环境。 图1 经典控制问题MountainCar-v0(图片来源:https://gym.openai.com/envs/MountainCar-v0
相关文章
相关标签/搜索