吴恩达机器学习笔记——照片OCR

时间 2020-12-30

原文原文链接

照片OCR流水线照片OCR是一种可以识别图片中的文字内容的技术。照片OCR的流水线可以分为三步：文本识别字符分割字符分类识别文本识别给定一组正负样本进行模型训练，从照片中识别出可能是文字的区域，在结果图中，灰度越低，说明判断为文本的概率越大。去除掉一些形状不合理的部分。使得预判为文本的地方扩大、相连。滑动窗口使用一个以一定步长移动的框，对框住的区域使用模型判断是否为正样本。在

>>阅读原文<<