JavaShuo
栏目
标签
on-policy
on-policy
全部
A thorough understanding of on-policy and off-policy in Reinforcement learning
2020-12-24
on-policy
off-policy
强化学习
Bourne强化学习笔记2:彻底搞清楚什么是Q-learning与Sarsa
2020-12-30
Q-learning
Saras
off-policy
on-policy
DQN
Bourne强化学习笔记1:用简单例子说明Off-policy的思想与使用方法
2021-01-13
off-policy
Q-learning
on-policy
强化学习:基于MDP的经典RL方法 (基于南大俞扬博士演讲的少量修改和补充)
2021-01-16
Q-learning
SARSA
off-policy
on-policy
每日一句
每一个你不满意的现在,都有一个你没有努力的曾经。