[强化学习-5] 值函数近似

值函数近似 前几篇博客讲了如何进行值函数估计,估计完之后这些结果怎么保持呢,状态动作空间很小的就存在表中,用的时候查表获取v(s)和Q(s, a),但当状态空间是高维连续时,需要储存的东西就太多了,这个表就不行了,这时我们会采用函数近似(function approximation)的方式对值函数进行参数化近似: 一般的函数近似有 - Linear combinations of features
相关文章
相关标签/搜索