Deep Q-Learning深度增强学习算法

时间 2020-12-24

原文原文链接

DQN算法由于某些环境中状态过多，通过传统Q-learning的方法，维护一张规模巨大的Q表显然是不现实的。DQN利用神经网络代替了Q表，只需要通过对实际训练的采样数据进行训练，就可以近似模拟Q表的数值初始化记忆库D 初始化Q估计神经网络 => Q_eval 初始化Q现实神经网络 => Q_real For episode = 1 in M 初始化序列s_t = {x1, x2, … ,xn}