论文阅读:Polysemous Visual-Semantic Embedding for Cross-Modal Retrieval

多义词的视觉语义的嵌入式交叉检索,来自 CVPR 2019 项目地址 摘要 视觉嵌入的目标是找到一个共享的空间,在这个空间中相关的视觉和文本彼此之间比较接近。当前大多数方法都学习将实例映射到共享空间中单个点的内嵌式嵌入函数(映射是一对一的)。不幸的是,内射式嵌入不能有效地处理具有多种可能含义的多义词实例。最好情况下,它只能找到不同含义的平均的表达。这阻止了它在真实场景中的使用,它们的跨模态的联系也
相关文章
相关标签/搜索