视频动作识别——TLE模型解读

Deep Temporal Linear Encoding Networks 这是CVPR2017的文章,主要提出了一种时序线性编码层(Temporal Linear Encoding, TLE)来对视频分段提取后的特征图进行融合编码,最后得到的效果相对来说已经很不错了。搜索的时候发现没有什么对它解读的文章,于是就自己看完来大概写一下。 TLE这篇文章认为,在一段视频中,连续帧之间的移动通常很微小
相关文章
相关标签/搜索