论文笔记：《Playing Atari with Deep Reinforcement Learning》

时间 2020-12-30

原文原文链接

文章摘要：本文是第一篇使用深度学习和强化学习结合起来的模型的论文。作者采用CNN作为深度学习模型，结合Q-Learning强化学习算法进行训练。CNN的输入为高维原始像素，输出为估计期望奖赏的估值函数。通过本文训练的神经网络在7个Atari 2600游戏上的得分有6个胜过了以往最好方法，有3个游戏超过了人类专家。深度学习与强化学习的结合：一方面，强化学习在视频和语音方面的主要困难在于，学习

>>阅读原文<<