视频理解 S3D,I3D-GCN,SlowFastNet, LFB

接着上次的《活体检测Face anti-spoofing综述》,再来说讲arXiv上新挂的文章:算法   最近看了下几篇动做识别,视频理解的文章,在这里记下小笔记,简单过一下核心思想,以便后续查阅及拓展使用。网络 文章主要想探索的问题以下:架构 1.如何改造I3D,使其更轻量且性能更好?框架 2.如何改造I3D,使其理解视频场景里的物体交互?ide 3.如何高效融合不一样帧率,不一样 tempor
相关文章
相关标签/搜索