【PaperNotes】视频分类【一】

Appearance-and-Relation Networks for Video Classification 简介 提出ARTNet,学习端到端的视频表征 ARTNets是由多个SMART blocks堆叠而来的,SMART可用于同时从RGB输入中建模出appearance与relation SMART将spatiotemporal学习分为两部分:用于空间建模的appearance分支与用于
相关文章
相关标签/搜索