译:Two-Stream Convolutional Networks for Action Recognition in Videos

摘要:咱们研究了用于训练视频中行为识别的深度卷积网络架构。这个挑战是捕捉静态帧中的外观和连续帧间的运动的互补信息。咱们也旨在推广这个在数据驱动的学习框架中表现得最好的手工特征。web 本文一共作出了3个贡献:算法 首先,本文提出了一个two-stream卷积网络架构,这个架构由时间和空间网络构成。 而后,咱们验证了,尽管是有限的训练数据集,在多帧密集光流上训练的卷积网络仍然可以表现出很好的性能。
相关文章
相关标签/搜索