强化学习入坑之路04

时间 2021-05-20

标签我的博客神经网络深度学习繁體版

原文原文链接

强化学习入坑之路04 今天继续强化学习的学习，这些内容的学习主要参考了李宏毅的强化学习教程，在此基础上加入了个人的理解和总结。好，废话少说下面开始进入正题。 1.Q-learning（DQN） State Value Function 首先我们要介绍的就是Q-learning的方法，Q-learning是一种value-based 的方法，在这一类的方法中我们不需要进行策略的学习，需要学习只是价值

>>阅读原文<<