强化学习的一些算法

时间 2021-01-14

原文原文链接

参考资料：https://spinningup.openai.com/en/latest/spinningup/rl_intro2. 强化学习算法的种类 Model-Free vs Model-Based RL 强化学习算法的一个重要分支是：智能体是否有能力从环境学习一个模型。 Model-Based 优点：希望智能体能够根据自己的思考做出计划，可以观测到可能的选择值，并在选择之间做出明确的决定。