连接图像和自然语言(翻译)一

摘要 人工智能领域的一个长期目标是开发可以感知和理解我们周围丰富的视觉世界的代理,并且可以用自然语言与我们沟通。由于计算基础设施,数据收集和算法的同步发展,在过去几年里,这个目标已经取得重大进展。视觉识别方面的进步尤为迅速,现在的计算机可以将图像分类为与人类相媲美的类别,甚至在某些情况下,例如对犬类进行分类,可以超越人类。然而,尽管取得了令人鼓舞的进展,但是视觉识别的大部分进展仍然是在为图像分配一
相关文章
相关标签/搜索