attention

原理介绍 相关论文 Hierarchical Attention Networks for Document Classification Word Encoder: ①给定一个句子si,例如 The superstar is walking in the street,由下面表示[wi1,wi2,wi3,wi4,wi5,wi6,wi1,wi7],我们使用一个词嵌入矩阵W将单词编码为向量 使用双向
相关文章
相关标签/搜索