强化学习入坑之路04

强化学习入坑之路04 今天继续强化学习的学习,这些内容的学习主要参考了李宏毅的强化学习教程,在此基础上加入了个人的理解和总结。好,废话少说下面开始进入正题。 1.Q-learning(DQN) State Value Function 首先我们要介绍的就是Q-learning的方法,Q-learning是一种value-based 的方法,在这一类的方法中我们不需要进行策略的学习,需要学习只是价值
相关文章
相关标签/搜索