Deep Q-Learning深度增强学习算法

DQN算法 由于某些环境中状态过多,通过传统Q-learning的方法,维护一张规模巨大的Q表显然是不现实的。DQN利用神经网络代替了Q表,只需要通过对实际训练的采样数据进行训练,就可以近似模拟Q表的数值 初始化记忆库D 初始化Q估计神经网络 => Q_eval 初始化Q现实神经网络 => Q_real For episode = 1 in M 初始化序列s_t = {x1, x2, … ,xn}
相关文章
相关标签/搜索