Noisy DQN

论文链接:Noisy DQN(MeireFortunato et al., 2019) 在深度强化学习智能体中引入了参数噪声—— NoisyNet,并且该智能体策略的随机性可以用来帮助有效的探索。利用梯度下降法学习噪声参数和剩余网络权值。对于 A3C,DQN,Dueling Agent,可以使用这个 NoisyNet 来替代传统的探索启发式方法(如,熵奖励和 ϵ − g r e e d y \ep
相关文章
相关标签/搜索