七月算法强化学习 第四课 学习笔记

Deep Q-Network 1.复习Q值函数 SARSA 2.Q-Learning  如果(s,a)状态太多太复杂怎么办?(围棋、Atari游戏,星际争霸) 拟合值函数Q(s,a) 几种值函数逼近(Value Function Approximation) 值函数 Linear Combination of Features  Neural Network  Decision Tree  Nea
相关文章
相关标签/搜索