译:Two-Stream Convolutional Networks for Action Recognition in Videos.md

摘要:我们研究了用于训练视频中行为识别的深度卷积网络架构。这个挑战是捕捉静态帧中的外观和连续帧间的运动的互补信息。我们也旨在推广这个在数据驱动的学习框架中表现得最好的手工特征。 本文一共做出了3个贡献: 首先,本文提出了一个two-stream卷积网络架构,这个架构由时间和空间网络构成。 然后,我们验证了,尽管是有限的训练数据集,在多帧密集光流上训练的卷积网络仍然能够表现出很好的性能。 最后,我们
相关文章
相关标签/搜索