文字检测算法CTPN网络模型及tensorflow版本代码介绍

网络结构: 1、基础网络时VGG16,在conv5_3卷积之后的特征图上进行后续处理 2、在conv5_3的特征图之上,使用3x3的卷积核进行滑窗处理,这就是Faster R-CNN中使用的RPN网络 3、然后以特征图的行为单位,将每行内容分别输入到双向LSTM循环网络中,将双向循环网络的输出结果进行concat连接,每个LSTM输出的结果是128维向量,所以每个位置的输出结果是256维的向量,得
相关文章
相关标签/搜索