【PaperNotes】视频分类【一】

时间 2021-01-06

原文原文链接

Appearance-and-Relation Networks for Video Classification 简介提出ARTNet，学习端到端的视频表征 ARTNets是由多个SMART blocks堆叠而来的，SMART可用于同时从RGB输入中建模出appearance与relation SMART将spatiotemporal学习分为两部分：用于空间建模的appearance分支与用于