强化学习的一些算法

参考资料:https://spinningup.openai.com/en/latest/spinningup/rl_intro2. 强化学习算法的种类 Model-Free vs Model-Based RL 强化学习算法的一个重要分支是:智能体是否有能力从环境学习一个模型。 Model-Based 优点:希望智能体能够根据自己的思考做出计划,可以观测到可能的选择值,并在选择之间做出明确的决定。
相关文章
相关标签/搜索