强化学习介绍

两年前,伦敦的一家小公司DeepMind向Arxiv上传了他们的开创性论文“ Playing Atari with Deep Reinforcement Learning ”。在那篇文章中,他们演示了计算机是如何经过只观察屏幕像素,并在游戏得分增长时收到奖励这种学习模式去玩Atari 2600 视频游戏的。结果是显著的,由于每一个游戏和每一个游戏的目标是很是不一样的,这些设计的游戏对人类而言也是不
相关文章
相关标签/搜索