谷歌街景中路牌、广告等标识文字的识别(文本识别在自然场景下的应用)之文本识别分类器

1.简介 谷歌街景中的文本读取主要分为文本检测和文本识别。这两个模块各使用了一个训练好的CNN分类器用于字符的判断和识别。CNN基于字符训练数据集中的正样本和负样本,从中学习字符的特征表达,并训练形成最终的分类器。 文本检测模块训练的是一个2元分类器,用于判别该CNN视野范围内是否包含文字,称为字符判断分类器;文本识别模块训练的是一个62元分类器(针对10个数字和52个大小写英文字母),识别该CN
相关文章
相关标签/搜索