图像标注:图像文本语义对齐

1)没有标签的图像语义如何提取 2)端到端的对齐过程如何构建,具体损失函数是什么 3)attention如何加入,双端反馈如何建立联系,attention训练过程的损失函数是什么 1: Karpathy A, Fei-Fei L. Deep Visual-Semantic Alignments for Generating Image Descriptions. IEEE Trans Patter
相关文章
相关标签/搜索