[翻译]End-to-End Learning of Motion Representation for Video Understanding

时间 2021-01-04

原文原文链接

摘要尽管端到端学习的表示最近取得了成功，但手工制作的光流特征仍然被广泛应用于视频分析任务中。为了填补这一空白，我们提出了TVNet，一个新颖的端到端可训练神经网络，从数据中学习光流的特征。TVNet包含了一个特定的光流解算器，即TV-L1方法，并通过将其优化迭代展开为神经层来初始化。因此，TVNet可以直接使用，无需任何额外的学习。此外，它可以与其他特定于任务的网络自然地连接起来，以形成端到端结

>>阅读原文<<