DRL（二）—— RL简介

时间 2021-01-19

原文原文链接

RL Structure RL中基本包括三个部分，如下图： Model-Based RL 在model-based RL里，绿格子里是预判下一个状态St+1。橙色格子依然是产生样本，绿色格子是利用这些样本去产生一个fφ，利用这个函数，可以预测下一个状态。用样本使这个函数越来越拟合。这样可以得到一个确定的policy，a deterministic policy，在确定的环境中可以工作的较好，但是

>>阅读原文<<

1. 深度Q-learning简介【RL系列】
2. 强化学习简介【RL系列】
3. DRL(四)——Value Function
4. 李宏毅-DRL-S1
5. DRL---------DQN详解
6. DRL-FlappyBird
7. 强化学习介绍（RL）
8. DRL(一)——Supervised Learning and Imitation
9. DRL笔记系列一
10. DRL（三）——Policy Gradient
更多相关文章...
• SVN 简介 - SVN 教程
• DTD 简介 - DTD 教程
• Github 简明教程
• Java Agent入门实战（一）-Instrumentation介绍与使用