粗读CVPR2019 论文 Transfer Learning via Unsupervised Task Discovery for Visual Question Answering

声明:本文为个人观点,如有不同意见,希望评论区指出,共同进步。 文章解决的问题 现有的大批量的视觉数据集,标签,区域选择边框为在图像中学习丰富的可表达信息提供了一定的基础。但是,如何将视觉概念给抽取出来并且传给一个视觉相关问题,并由一个问题回答模型给出这个问题的答案依然是当前要解决的一个点。我们称这类问题的总称叫做visual question answering (VQA)。 文章中的做法 作者
相关文章
相关标签/搜索