Image caption——图像理解——看图说话

    本文章没有太多公式,仅仅讲述个人理解,主要怎对入门人士。文中定有许多错误,希望大家能相互交流。     Image caption顾名思义,即可让算法根据输入的一幅图自动生成对应的描述性文字。有点类似于看图说话的感觉,此次我想讲的主要是自2015年出现的encoder-decoder这一些列模型以及他们的变体。纵观整个image caption的发展史,它们是层层推进,通过解决不同的问题,
相关文章
相关标签/搜索