关系性深度强化学习

深度强化学习的缺陷: 采样效率低以及每每不能泛化至任务中看似微小的变化 。 这些缺陷代表,具备较强能力的深度强化学习模型每每对其所训练的大量数据过分拟合,所以没法理解它们试图解决的问题的抽象性、可解释性和可归纳性。 关系性深度强化学习 这种新型强化学习能够经过结构化感知和关系推理提升常规方法的效率、泛化能力和可解释性。 RRL 背后的核心思想即经过使用一阶(或关系)语言表示状态、动做和策略,将强化
相关文章
相关标签/搜索