【ICCV2019】EPIC-Fusion: Audio-Visual Temporal Binding for Egocentric Action Recognition

论文下载链接: EPIC-Fusion: Audio-Visual Temporal Binding for Egocentric Action Recognition 主要思想 使用 Audio-Vision-Flow 3种模态数据 作为输入的3种数据在时序上不同步,但时差在一定范围内 在网络中段进行数据融合,即mid-fusion 简介 文章使用EPIC-KITCHEN数据集,包括3种模态数据
相关文章
相关标签/搜索