CTPN/CRNN的OCR自然场景文字识别理解(二)

CRNN 1) 端到端可训练(把CNN和RNN联合训练) 2) 任意长度的输入(图像宽度任意,单词长度任意) 3) 训练集无需有字符的标定 4) 带字典和不带字典的库(样本)都可以使用 5) 性能好,而且模型小(参数少) 网络结构 架构包括三部分: 1) 卷积层,从输入图像中提取特征序列; 2) 循环层,预测每一帧的标签分布; 3) 转录层,将每一帧的预测变为最终的标签序列。 在CRNN的底部,卷
相关文章
相关标签/搜索