[翻译]End-to-End Learning of Motion Representation for Video Understanding

摘要 尽管端到端学习的表示最近取得了成功,但手工制作的光流特征仍然被广泛应用于视频分析任务中。为了填补这一空白,我们提出了TVNet,一个新颖的端到端可训练神经网络,从数据中学习光流的特征。TVNet包含了一个特定的光流解算器,即TV-L1方法,并通过将其优化迭代展开为神经层来初始化。因此,TVNet可以直接使用,无需任何额外的学习。此外,它可以与其他特定于任务的网络自然地连接起来,以形成端到端结
相关文章
相关标签/搜索