Collaborative Spatiotemporal Feature Learning for Video Action Recognition 阅读笔记

论文笔记 1 介绍 1.1 引子 在本文中,我们提出了一种新颖的协作时空(CoST)特征学习操作,它与权重共享约束共同学习时空特征。 给定3D体积视频张量,我们通过从不同角度观看它们,将其展平为三组2D图像。 然后将2D卷积应用于每组2D图像。 图1示出了来自示例性视频剪辑的三个视图的2D快照,其中一个人在体育场高跳。 H-W的视图是人类熟悉的自然景观。 通过在时间T上从该视图逐帧扫描视频,我们能
相关文章
相关标签/搜索