基于世界模型的深度强化学习

时间 2021-01-01

原文原文链接

起源世界模型[https://zhuanlan.zhihu.com/p/39928037]被lecun认为是弥补RL不足和通向下一代AI的要点。虽然Model-Based RL不是新概念，但是世界模型的构建方法，以及提升其泛化能力、注意力能力和记忆容量的设计还是颇具挑战性。 DaH和LSTM的发明人在今年五月提出了基于非监督学习训练大规模RNN，用于表征世界模型，并针对强化学习框架设计了智能体架