Pixel-Anchor: A Fast Oriented Scene Text Detector with Combined Networks——译文

时间 2020-12-30

原文原文链接

摘要最近，语义分割和通用目标检测框架被广泛应用于场景文本检测任务中。但是，实际应用中，两者单独使用都有明显的缺点。在本文中，我们提出一种新的可端对端训练的深度神经网络框架，叫做Pixel-Anchor，它通过特征共享和anchor水平的注意力机制将语义分割和SSD组合到一个网络来检测多方向的场景文本。为了处理在尺寸和宽高比变化较大的场景文本，我们在语义分割部分将FPN和ASPP操作组合在一起

>>阅读原文<<