吴恩达机器学习笔记——照片OCR

照片OCR流水线 照片OCR是一种可以识别图片中的文字内容的技术。 照片OCR的流水线可以分为三步: 文本识别 字符分割 字符分类识别 文本识别 给定一组正负样本进行模型训练,从照片中识别出可能是文字的区域,在结果图中,灰度越低,说明判断为文本的概率越大。 去除掉一些形状不合理的部分。使得预判为文本的地方扩大、相连。 滑动窗口 使用一个以一定步长移动的框,对框住的区域使用模型判断是否为正样本。 在
相关文章
相关标签/搜索