Action Recognition－Two Stream CNN论文笔记

时间 2021-01-12

原文原文链接

本文主要针对论文：《Two-Stream Convolutional Networks for Action Recognition in Videos》记录自己的理解。考虑到视频由空间和时间两个部分组成，空间部分更多表征Appearence信息，比如目标、场景等；而时间部分更多表征Motion信息，包括摄像机的运动或者目标物体的运动信息。所以该网络结构的设计考虑两个部分。 Two－stream