【OCR技术系列之三】大批量生成文字训练集

放假了,终于能够继续能够静下心写一写OCR方面的东西。上次谈到文字的切割,今天打算总结一下咱们怎么获得用于训练的文字数据集。若是是想训练一个手写体识别的模型,用一些前人收集好的手写文字集就行了,好比中科院的这些数据集。可是若是咱们只是想要训练一个专门用于识别印刷汉字的模型,那么咱们就须要各类印刷字体的训练集,那怎么获取呢?借助强大的图像库,本身生成就好了!php 先捋一捋思路,生成文字集须要什么步
相关文章
相关标签/搜索