V4d:4d Convolutional Neural Networks For Video-level Representation Learning

本文是一篇ICLR2020的文章 文章地址: http://xxx.itp.ac.cn/abs/2002.07442 Open Review: https://openreview.net/forum?id=SJeLopEYDH Background 对于视频分类、动作识别等任务来说,如何简洁、高效地建模时序信息一直是重要的研究问题。3D-CNN的提出虽然提供了一个时序建模的方案,但是它的运算量一
相关文章
相关标签/搜索