FCN和RPN两种特征提取框架的区别

场景文本检测的难点主要在于目标的方向、形状、尺度变化显著,且天然场景背景复杂。现有的基于深度学习的场景文本检测框架大体分为两类: 一类基于FCN框架提取文本显著图,但此类方法引入大量噪声干扰结果准确性(由于最后要上采样匹配),需对显著图进行后处理(如:反卷积),没法实现端到端; 一类基于RPN框架提取proposal进行分类,但文本目标形状、方向、尺度的变化将proposal的搜索空间极大增大,使
相关文章
相关标签/搜索