Visual Reasoning | GQA Dataset

参考博客: https://blog.csdn.net/hester_hester/article/details/103238649 https://zhuanlan.zhihu.com/p/64183181 CLEVR虽然消除了dataset bias,但是人工合成的图像和问题组成,多样性较低,类和属性较少,容易使模型记住所有组合。 因此提出GQA,由真实图像组成,并在一个大的语义空间中运行,
相关文章
相关标签/搜索