【机器学习笔记】照片OCR

时间 2021-01-08

原文原文链接

照片OCR 照片OCR就是想要读取图像中的文字，因此工作流程如下： 1、文本检测 2、字符切割 3、字符识别一、首先来看文本检测——滑动窗口 1、先学习行人检测的思路。 1）首先要确定检测框的尺寸8040 拿到一个数据集，训练出一个分类器，能够判断8040的图像内有没有行人。 2）对于输入一张图片，从图片左上角开始划一个检测框，送入分类器识别是否有行人；再根据步长来移动检测框，直到划过了整张图片

>>阅读原文<<