《reinforcement learning：an introduction》第十一章《Off-policy Methods with Approximation》总结

时间 2020-12-24

标签增强学习 sutton RL reinforcement learni an introduction 繁體版

原文原文链接

由于组里新同学进来，需要带着他入门RL，选择从silver的课程开始。对于我自己，增加一个仔细阅读《reinforcement learning：an introduction》的要求。因为之前读的不太认真，这一次希望可以认真一点，将对应的知识点也做一个简单总结。 The tabular off-policy methods developed in Chapters 6 and 7 read

>>阅读原文<<

1. 《reinforcement learning：an introduction》第十章《On-policy Control with Approximation》总结
2. 《reinforcement learning：an introduction》第九章《On-policy Prediction with Approximation》总结
3. 《reinforcement learning：an introduction》第八章《Planning and Learning with Tabular Methods》总结
4. 《reinforcement learning：an introduction》第十三章《Policy Gradient Methods》总结
5. 《reinforcement learning：an introduction》第六章《Temporal-Difference Learning》总结
6. 《reinforcement learning：an introduction》第七章《Multi-step Bootstrapping》总结
7. Reinforcement Learning：An Introduction Chapter 2 Multi-armed Bandits
8. Reinforcement Learning：An Introduction Chapter 1 学习笔记
9. Reinforcement Learning: value function approximation
10. 强化学习（RLAI）读书笔记第十一章 Off-policy Methods with Approximation
更多相关文章...
• 第一个Spring程序 - Spring教程
• 第一个MyBatis程序 - MyBatis教程
• 算法总结-双指针
• 算法总结-回溯法

最新文章

1. JDK JRE JVM,JDK卸载与安装
2. Unity NavMeshComponents 学习小结
3. Unity技术分享连载（64）|Shader Variant Collection|Material.SetPassFast
4. 为什么那么多人用“ji32k7au4a83”作密码？
5. 关于Vigenere爆0总结
6. 图论算法之最小生成树（Krim、Kruskal）
7. 最小生成树简单入门
8. POJ 3165 Traveling Trio 笔记
9. 你的快递最远去到哪里呢
10. 云徙探险中台赛道：借道云原生，寻找“最优路线”

本站公众号

欢迎关注本站公众号,获取更多信息

1. 《reinforcement learning：an introduction》第十章《On-policy Control with Approximation》总结
2. 《reinforcement learning：an introduction》第九章《On-policy Prediction with Approximation》总结
3. 《reinforcement learning：an introduction》第八章《Planning and Learning with Tabular Methods》总结
4. 《reinforcement learning：an introduction》第十三章《Policy Gradient Methods》总结
5. 《reinforcement learning：an introduction》第六章《Temporal-Difference Learning》总结
6. 《reinforcement learning：an introduction》第七章《Multi-step Bootstrapping》总结
7. Reinforcement Learning：An Introduction Chapter 2 Multi-armed Bandits
8. Reinforcement Learning：An Introduction Chapter 1 学习笔记
9. Reinforcement Learning: value function approximation
10. 强化学习（RLAI）读书笔记第十一章 Off-policy Methods with Approximation

>>更多相关文章<<