用于视觉问答的具有模态内和模态间注意力的动态融合模型《Dynamic Fusion with Intra- and Inter-modality Attention Flow for Visual 》

时间 2021-01-12

原文原文链接

目录一、文献摘要介绍二、网络框架介绍三、实验分析四、结论本文有点长，请耐心阅读，定会有收货。如有不足，欢迎交流，这篇文章和上篇文章，有着相同的构思，请参考上篇文章。另附:本论文地址一、文献摘要介绍 Learning effective fusion of multi-modality features is at the heart of visual question