论文阅读 PixelLink: Detecting Scene Text via Instance Segmentation

原文https://arxiv.org/pdf/1801.01315.pdf 摘要(Abstract) 最先进的场景文本检测算法是基于深度学习的方法,它依赖于边界框回归,并执行至少两种预测:文本/非文本分类和位置回归。回归在这些方法中对边界框的获取起着关键作用,但这并不是必不可少的,因为文本/非文本预测也可以看作是一种包含完整位置信息的语义分割。然而,场景图像中的文本实例之间往往距离很近,很难通过
相关文章
相关标签/搜索