迁移学习在多智能体强化学习中的应用(Action Advising)

十三、Action Advising 1、Multi-Agent RL 中的 Transfer Learning (1)一些定义 在多智能体系统中使用TL是为了重复利用已经学到的知识从而提高学习的速度并且使原本复杂的任务变得容易学习。多智能体系统的TL中有如下几个概念: 1、knowledge space K \mathscr{K} K :它包含了当前的任务(target task)中的sampl
相关文章
相关标签/搜索