Tensorflow实例：实现深度强化学习--策略网络

时间 2019-12-05

原文原文链接

深度强化学习简介强化学习（reinforcement Learning）是机器学习的一个重要分支，主要用来解决连续决策的问题。强化学习能够在复杂的、不肯定的环境中学习如何实现咱们设定的目标。一个强化学习问题包括三个主要概念，即python 环境状态（Environment State）行动（Action）奖励（Reward）而强化学习的目标就是得到最多的累计奖励。咱们要让强化学习模型根据

>>阅读原文<<