【计算机科学】【2016.11】用于强化学习的深度学习方法

本文为葡萄牙里斯本技术大学(作者:Daniel Luis Simões Marta)的硕士论文,共95页。 本文主要研究了在强化学习中应用深度学习方法时,分离状态感知和函数逼近的挑战。作为一个起点,高维状态被认为是将强化学习应用于现实任务时的基本限制。针对维数灾难问题,我们建议降低数据的维数,以获得简洁的代码(环境的内部表示),作为强化学习框架中的替代状态。在过去的几十年中,人们采用了不同的方法,
相关文章
相关标签/搜索