深度加强学习David Silver(六)——Value Function Approximation

本节课主要内容:web Value Function Approximation Batch Methods Value Function Approximation 加强学习能够用来解决大规模数据集的问题。在以前的问题中,咱们经过一个lookup表格来表现价值函数:每一个状态都有一个特定值 V(s) ,或者每一个状态-动做对都有一个特定值 Q(s,a) 看。在实际问题中,会遇到两个限制:一般须要
相关文章
相关标签/搜索