深度增强学习前沿算法思想

http://www.iteye.com/news/32139 目前深度增强学习的算法都可以包含在Actor-Critic框架下,如图2所示。  图2 Actor-Critic框架 把深度增强学习的算法认为是智能体的大脑,那么这个大脑包含了两个部分:Actor行动模块和Critic评判模块。其中Actor行动模块是大脑的执行机构,输入外部的状态s,然后输出动作a。而Critic评判模块则可认为是大
相关文章
相关标签/搜索