强化学习笔记(5)价值估计函数Value Function Approximation

文章目录 Introduction 如何选择Function Approximator? Incremental Methods Gradient Descent 特征向量的形式 Linear Value Function Approximation线性价值估计函数 正确结果 Batch Methods Least Squares Prediction Experience Replay DQN
相关文章
相关标签/搜索