JavaShuo
栏目
标签
西瓜书强化学习QLearning算法与网上版本比较
时间 2020-12-29
标签
强化学习
QLearning
机器学习
繁體版
原文
原文链接
西瓜书上的QLearning算法与网上的版本比较: 不同点:西瓜书上的Q(x,a)就是Q表,π(x,a)就是贪婪算法选择动作的概率,这个值对应于ε。 西瓜书上的第六行的公式和另一版本的更新值公式的区别,网上版本是下一个状态的maxQ(x',a'), 因为是求最大值,所以不需要西瓜书上的第五行和第七行代码,直接查找下一个状态x'的最大值得Q(x',a'),而西瓜书上的不是。
>>阅读原文<<
相关文章
1.
强化学习——Qlearning
2.
强化学习--QLearning
3.
强化学习——Qlearning——value based
4.
强化学习学习总结(二)——QLearning算法更新
5.
强化学习学习总结(一)——Qlearning
6.
西瓜书学习(三)—SVM(上)
7.
西瓜书学习(一)—决策树(上)
8.
机器学习-西瓜书
9.
西瓜书学习之路
10.
西瓜书学习整理
更多相关文章...
•
PHP 类型比较
-
PHP教程
•
MySQL的版本以及版本号
-
MySQL教程
•
Kotlin学习(一)基本语法
•
Tomcat学习笔记(史上最全tomcat学习笔记)
相关标签/搜索
强化学习
机器学习-西瓜书
机器学习(西瓜书)
qlearning
算法学习
西瓜
强化学习(第2版)
较强
比较
强化学习篇
PHP 7 新特性
PHP教程
网站品质教程
算法
学习路线
计算
0
分享到微博
分享到微信
分享到QQ
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。
最新文章
1.
JDK JRE JVM,JDK卸载与安装
2.
Unity NavMeshComponents 学习小结
3.
Unity技术分享连载(64)|Shader Variant Collection|Material.SetPassFast
4.
为什么那么多人用“ji32k7au4a83”作密码?
5.
关于Vigenere爆0总结
6.
图论算法之最小生成树(Krim、Kruskal)
7.
最小生成树 简单入门
8.
POJ 3165 Traveling Trio 笔记
9.
你的快递最远去到哪里呢
10.
云徙探险中台赛道:借道云原生,寻找“最优路线”
本站公众号
欢迎关注本站公众号,获取更多信息
相关文章
1.
强化学习——Qlearning
2.
强化学习--QLearning
3.
强化学习——Qlearning——value based
4.
强化学习学习总结(二)——QLearning算法更新
5.
强化学习学习总结(一)——Qlearning
6.
西瓜书学习(三)—SVM(上)
7.
西瓜书学习(一)—决策树(上)
8.
机器学习-西瓜书
9.
西瓜书学习之路
10.
西瓜书学习整理
>>更多相关文章<<