【论文】An End-to-End TextSpotter with Explicit Alignment and Attention

作者和相关链接 代码链接:caffe代码传送门 摘要 在自然图像当中的文本检测与识别一直被认作是顺序处理的两个相对独立的任务。由于学习困难和收敛率存在显着差异,因此共同培训两项任务并非易事。在这项工作当中,我们呈现了一个迄今为止简单高效的框架,它能在一个统一的架构当中连续性的处理两个任务。我们的主要贡献包括以下的三个方面:(1)我们提出了一种新的文本对齐层,该层能够计算任意方向下文本实例的卷积特征
相关文章
相关标签/搜索