Action Recognition-Two Stream CNN论文笔记

本文主要针对论文:《Two-Stream Convolutional Networks for Action Recognition in Videos》记录自己的理解。 考虑到视频由空间和时间两个部分组成,空间部分更多表征Appearence信息,比如目标、场景等;而时间部分更多表征Motion信息,包括摄像机的运动或者目标物体的运动信息。所以该网络结构的设计考虑两个部分。 Two-stream
相关文章
相关标签/搜索