Visual Genome 数据集标注内容

二、Visual Genome 的数据表现web Visual Genome 数据集包括 7 个主要部分:区域描述、对象、属性、关系、区域图、场景图和问答对。图 4 展现了一幅画的每个部分的例子。要对图像进行理解的研究,咱们从收集描述和问答对开始。这些是原始的文本,没有任何长度和词汇的限制。下一步,咱们从描述中提取对象、属性和关系。这些对象、属性和关系一块儿构造了咱们的场景图,这表明了通常的图像。
相关文章
相关标签/搜索