强化学习:从网格世界到自动驾驶

0. Agents, Environments, and Rewards 在过去几年中,人工智能研究人员发表的许多主要公告都是一门称为强化学习(RL)的学科。 最近的突破主要是由经典RL创意的微小转折所驱动,这得益于强大的计算硬件和利用所述硬件的软件的可用性。 为了了解现代深度RL模型对于计算的饥饿程度,下表是最近RL进展的非详尽集合以及完成每项任务所需的计算资源的估计。 请注意,上表中的任务都经
相关文章
相关标签/搜索