深度强化学习(理论篇)—— 从 Critic-only、Actor-only 到 Actor-Critic

本文转自:https://blog.csdn.net/lipengcn/article/details/81253033 # 1 概述 ## 1.1 强化学习 v.s. 监督学习 强化学习,与监督学习、无监督学习并列,做为机器学习的三大类。强化学习,研究的是 agent 从与 environment 交互过程进行学习,学习如何做用于 environment,从而能够从 environment 获得
相关文章
相关标签/搜索