论文笔记 A Neural Multi-sequence Alignment TeCHnique (NeuMATCH) (CVPR2018)

这篇文章做的任务是异构序列数据的对齐,针对以视频文本为例,提出了用LSTM堆栈结构来处理多种对齐任务(one-to-one, one-to-many, skipping unmatched elements,non-monotonic alignment等)。 示例 这项任务的基本定义就是,输入连续的视频帧 V={vi}i=1,2,...N V = { v i } i = 1 , 2 , . .
相关文章
相关标签/搜索