Context R-CNN一种基于注意力机制的视频检测算法

时间 2021-01-12

原文原文链接

最近遇到同一环境下，拍摄多张图片，检测结果存在差异的问题，故调研，考虑使用融合多帧信息去解决上述问题，发现这篇论文，该算法适用于我当前的问题，更适用于从事监控领域的同学，算法细节不赘述，看算法主体思路：算法前半部分与双阶段RPN网络基本无异，只是输入为多帧图片，得到若干anchor box的featrues，其中关键帧提取出n个，关键帧与其他帧共m个，此处双阶段检测相比于单阶段在视频信息融合上

>>阅读原文<<