论文笔记:SlowFast Networks for Video Recognition

论文笔记:SlowFast Networks for Video Recognition 灵魂三问: 作者想干什么? 提取视频信息 是怎么实现的? 通过分别低采样和高采样 低采样:提取空间语义(spacial sematics) 高采样:提取时域上的运动 实现了什么目标? 在动作识别以及检测都有很显著提升 测试集:Kinetics, Charades, AVA, Intuition 在图片中, I
相关文章
相关标签/搜索