强化学习task01基础

时间 2020-12-30

标签笔记繁體版

原文原文链接

强化学习基础强化学习讨论的问题是一个智能体(agent)可以理解为是一个ai，把他放到一个复杂的环境(environment)里面去，规定一个目标，他自己想办法尝试去极大化它能获得的奖励。在强化学习过程中，agent 跟 environment 一直在交互，类比为人类与环境无时无刻不在交互。 Agent 在环境会得到一个初始的状态，agent 会利用这个状态通过一个决策policy来输出一个

>>阅读原文<<