强化学习task01基础

强化学习基础 强化学习讨论的问题是一个 智能体(agent)可以理解为是一个ai,把他放到一个复杂的环境(environment)里面去,规定一个目标,他自己想办法尝试去极大化它能获得的奖励。 在强化学习过程中,agent 跟 environment 一直在交互,类比为人类与环境无时无刻不在交互。 Agent 在环境会得到一个初始的状态,agent 会利用这个状态通过一个决策policy来输出一个
相关文章
相关标签/搜索