【机器学习笔记】照片OCR

照片OCR 照片OCR就是想要读取图像中的文字,因此工作流程如下: 1、文本检测 2、字符切割 3、字符识别 一、首先来看文本检测——滑动窗口 1、先学习行人检测的思路。 1)首先要确定检测框的尺寸8040 拿到一个数据集,训练出一个分类器,能够判断8040的图像内有没有行人。 2)对于输入一张图片,从图片左上角开始划一个检测框,送入分类器识别是否有行人;再根据步长来移动检测框,直到划过了整张图片
相关文章
相关标签/搜索