深度强化学习简介

时间 2020-12-27

原文原文链接

点击我爱计算机视觉标星，更快获取CVML新技术本文原载于知乎，已获作者授权转载，请勿二次转载。 https://zhuanlan.zhihu.com/p/112151840 深度Q-网络（DQN）点燃了深度强化学习的浪潮，通过经验重放（experience replay）和目标网络（target network）来解决稳定性和收敛问题，使Q学习更接近有监督的学习。接下来介绍价值分布（value