Pixel-Anchor: A Fast Oriented Scene Text Detector with Combined Networks——译文

  摘要 最近,语义分割和通用目标检测框架被广泛应用于场景文本检测任务中。但是,实际应用中,两者单独使用都有明显的缺点。在本文中,我们提出一种新的可端对端训练的深度神经网络框架,叫做Pixel-Anchor,它通过特征共享和anchor水平的注意力机制将语义分割和SSD组合到一个网络来检测多方向的场景文本。为了处理在尺寸和宽高比变化较大的场景文本,我们在语义分割部分将FPN和ASPP操作组合在一起
相关文章
相关标签/搜索