强化学习(2):Sarsa 算法及 Sarsa(lambda) 算法

最近自己会把自己个人博客中的文章陆陆续续的复制到CSDN上来,欢迎大家关注我的 个人博客,以及我的github。 本文主要讲解 Sarsa 算法以及 Sarsa( λ \lambda λ) 算法的相关内容,同时还会分别附上一个莫烦大神写的例子。 一、Sarsa 算法 Sarsa 算法与 Q-Learning 算法相似,也是利用 Q 表来选择动作,唯一不同的是两者 Q 表的更新策略不同。该算法由于更
相关文章
相关标签/搜索