G-TAD: Sub-Graph Localization for Temporal Action Detection

时间 2021-01-02

原文原文链接

论文下载链接：https://arxiv.org/pdf/1911.11462.pdf 1 摘要对于动作检测而言，视频的文本信息是十分重要的线索之一，但是当前的工作主要集中于时序文本信息（temporal context），而忽视了另一个同样重要的语义文本信息（semantic context）。本文提出通过GCN模型自适应地融合多级语义文本信息，将时序动作检测问题转化为子图定位问题。具体就是将