论文笔记:《Playing Atari with Deep Reinforcement Learning》

文章摘要:本文是第一篇使用深度学习和强化学习结合起来的模型的论文。作者采用CNN作为深度学习模型,结合Q-Learning强化学习算法进行训练。CNN的输入为高维原始像素,输出为估计期望奖赏的估值函数。通过本文训练的神经网络在7个Atari 2600游戏上的得分有6个胜过了以往最好方法,有3个游戏超过了人类专家。   深度学习与强化学习的结合: 一方面,强化学习在视频和语音方面的主要困难在于,学习
相关文章
相关标签/搜索