2020-08-20 One-Shot Visual Imitation Learning via Meta-Learning 中的双头网络的理解

以下内容来自这个blog 4.1 Two-Head Architecture: Meta-Learning a Loss for Fast Adaptation 在标准的MAML框架中,在“前梯度更新”和“后梯度更新”中,使用的网络是相同的,都输出的是action,并且都使用标准的loss function。本文中,我们做出了这样的尝试:“前梯度更新”和“后梯度更新”依旧共用前面所有的架构,只是输
相关文章
相关标签/搜索