G-TAD: Sub-Graph Localization for Temporal Action Detection

论文下载链接:https://arxiv.org/pdf/1911.11462.pdf 1 摘要 对于动作检测而言,视频的文本信息是十分重要的线索之一,但是当前的工作主要集中于时序文本信息(temporal context),而忽视了另一个同样重要的语义文本信息(semantic context)。本文提出通过GCN模型自适应地融合多级语义文本信息,将时序动作检测问题转化为子图定位问题。具体就是将
相关文章
相关标签/搜索