Q-learning家族【强化学习】

本文将讲述经典的强化学习三部曲:Q-learning、DQN以及Double-DQN 先总结三者关系,Q-learning是经典智能算法,但是受限于高维拓展,于是DQN出现,将神经网络应用于Q-learning,使得高维情况得以解决,至于Double DQN是为了防止神经网络的过度估计,把Double Q-learning和DQN结合,将选择和评估action的网络分开。 Q-learning 故
相关文章
相关标签/搜索