【自然语言处理】--视觉问答(Visual Question Answering,VQA)从初始到应用

一、前述 视觉问答(Visual Question Answering,VQA),是一种涉及计算机视觉和自然语言处理的学习任务。这一任务的定义如下: A VQA system takes as input an image and a free-form, open-ended, natural-language question about the image and produces a na
相关文章
相关标签/搜索