R2-CNN文本检测(Rotational Region CNN)

总体框架 文章利用Faster R-CNN作为基本框架。 (1)使用RPN生成轴向对齐的包围框,包围着面向任意方向的文本; (2)对RPN提出的每一个文本框,用不同的pooled size ( 7 × 7, 11 ×3, 3 × 11 ) 进行池化,并利用连接的特征同时预测文本/非文本得分、轴向对齐框和倾斜最小面积框; (3)多任务损失更新参数(得分+轴向框+倾斜框); (3)最后,使用倾斜NMS
相关文章
相关标签/搜索