强化学习-->Deep Reinforcement Learning

由于逐渐有人将强化学习应用到 NLP 的任务上,有必要了解一些强化学习基础知识,本篇博文总结自台大教授李宏毅关于深度学习的公开课内容。web 咱们能够以上图来理解强化学习过程,咱们机器人 agent 经过 observation 了解到环境的 State ,采起一些 Action ,而且改变当前的环境,而后环境会反馈正向或负向的 reward 给 agent 。网络 举例来讲,让机器人玩电玩游戏:
相关文章
相关标签/搜索