Tensorflow实例:实现深度强化学习--策略网络

深度强化学习简介 强化学习(reinforcement Learning)是机器学习的一个重要分支,主要用来解决连续决策的问题。强化学习能够在复杂的、不肯定的环境中学习如何实现咱们设定的目标。 一个强化学习问题包括三个主要概念,即python 环境状态(Environment State) 行动(Action) 奖励(Reward) 而强化学习的目标就是得到最多的累计奖励。咱们要让强化学习模型根据
相关文章
相关标签/搜索