Q-learning家族【强化学习】

时间 2021-01-01

原文原文链接

本文将讲述经典的强化学习三部曲：Q-learning、DQN以及Double-DQN 先总结三者关系，Q-learning是经典智能算法，但是受限于高维拓展，于是DQN出现，将神经网络应用于Q-learning，使得高维情况得以解决，至于Double DQN是为了防止神经网络的过度估计，把Double Q-learning和DQN结合，将选择和评估action的网络分开。 Q-learning 故