9. 基于近似的在线策略预测方法--阅读笔记【Reinforcement Learning An Introduction 2nd】

文章目录 基于近似的在线策略预测方法 前言 1.值函数近似 2.预测目标 V E ‾ \overline {VE} VE 3.随机梯度和半梯度方法stochastic-gradient and semi-gradient 4.线性方法 5.线性方法的特征构造 5.1 多项式方法 5.2 傅里叶基 5.3 coarse coding粗糙编码特征 5.4 tile coding堆编码/瓦片编码 5.5
相关文章
相关标签/搜索