《图文匹配&VQA》小结

时间 2021-01-05

原文原文链接

图文匹配以及图像的QA是图像与文本多模态融合，是计算机视觉与自然语言处理的交叉。图文匹配：将图像与文本都映射到一个相同的语义空间，然后通过距离对他们的相似度进行判断。图文匹配问题与VQA最大的不同就是，需要比对两种特征之间的距离。将文本和图像分别做attention，DAN计算每一步attention后的文本和图像向量相似度累加得到similarity. VQA：给定一张图像和一个关于该图像内

>>阅读原文<<

1. js 正则匹配小结
2. 论文小综 | Using External Knowledge on VQA
3. VQA
4. PHP的正则匹配小结
5. 二分图匹配小知识点
6. Ants(最小权值二分图匹配)
7. 文本匹配
8. 匹配中文
9. 二分图最大匹配——总结
10. [Alg] 文本匹配-单模匹配-KMP
更多相关文章...
• Scala 模式匹配 - Scala教程
• Maven 构建配置文件 - Maven教程
• IDEA下SpringBoot工程配置文件没有提示
• IntelliJ IDEA 代码格式化配置和快捷键