Question-Guided Spatio-Temporal Contextual Attention for Video Question Answering 论文阅读笔记

1. 主要解决了什么问题?怎么解决的? 解决的问题: 现有方法没有充分利用 时空信息 与 question 的关系。 原文是这么说的:“the relationship between spatio-temporal information and question still has not been well utilized in most existing methods for Vide
相关文章
相关标签/搜索