VSE++: Improving Visual-Semantic Embeddings with Hard Negatives

1、前言 1.论文要解决的问题: 输入: MSCOCO,Flickr30K 输出: image to text (text to image):rankhtml 2, 本文的方法创新: 提出了一种新的计算loss的方案,主要针对与hard negtive,加大样本与hard negtive 的距离web 2、论文方法 Embedding 1) 图像采用VGG19或者ResNet152进行特征提取
相关文章
相关标签/搜索