TSN、TRN、ECO、 S3D、I3D-GCN、SlowFastNet、LFB

什么是动作识别?给定一个视频,通过机器来识别出视频里的主要动作类型。 动作识别表面是简单的分类问题,但从本质上来说,是视频理解问题,很多因素都会影响其中,比如不同类型视频中空间时间信息权重不同?视频长短不一致?视频中动作持续的起始终止时间差异很大?视频对应的语义标签是否模糊?   本文主要对比 video-level 动作识别的经典方法TSN,及其拓展变形版本的TRN和ECO。 Temporal
相关文章
相关标签/搜索