【计算机视觉】CTPN算法

CTPN的网络结构(图1): 问题 (1这一个格子变成了一条,5这个格子变成了一条(竖着的那个绿)) 要明白三个问题(我应该还有更多要明白的😓) 首先,CTPN中为何使用LSTM? CNN学习的是感受野内的空间信息,LSTM学习的是序列特征。对于文本序列检测,显然既需要CNN抽象空间特征,也需要序列特征(毕竟文字是连续的)。 双向LSTM,当前状态,不仅可以获取之前的信息,也可以获取之后所发生的
相关文章
相关标签/搜索