Multichannel Variable-Size Convolution for Sentence Classification(阅读理解)

它结合了不同版本的预先训练的词嵌入 使用可变大小的卷积滤波器进行不同粒度的短语特征提取 作者证明了使用预先训练的网络可以达到一个更好的结果 多通道输入 作者将一小批量的句子整合成相同的长度,而对应通道的未知字将被随机初始化,或者从下一节描述的互学习阶段获得良好的初始化,多通道输入的好处是(1)一个频繁的词在开始时可以有多个表示(而不是只有一个),这意味着它有更多可用的信息来利用(2)在一些word
相关文章
相关标签/搜索