Movie Question Answering: Remembering the Textual Cues for Layered Visual Contents心得体会

在本文中,为了回答有关电影的问题,提出了一个分层存储网络(LMN),该网络分别通过静态字存储模块和动态字幕存储模块来表示帧级和剪辑级电影内容。发表于AAAI2018 文章链接:Movie Question Answering: Remembering the Textual Cues for Layered Visual Contents 一、文章引入 桥接视觉理解和人机交互是人工智能的一项艰巨任
相关文章
相关标签/搜索