The categories of Reinforcement Learning 强化学习分类

RL分为三大类:网络

(1)经过行为的价值来选取特定行为的方法,具体 包括使用表格学习的 q learning, sarsa, 使用神经网络学习的 deep q network; 学习

(2)直接输出行为的 policy gradients;sed

(3)了解所处的环境, 想象出一个虚拟的环境并从虚拟的环境中学习。神经网络

另外一种分类方式:network

Model-free and Model-based   rsa

Model-free:不理解环境方法

相关文章
相关标签/搜索