NLP——机器翻译中的Attention

文章目录 框架 简介 相关性计算 框架 简介 Encoder-Decoder模型虽然非常经典,但是局限性也非常大。最大的局限性就在于编码和解码之间的唯一联 系就是一个固定长度的语义向量C。也就是说,编码器要将整个序列的信息压缩进一个固定长度的向量中。但是这样做有两个弊端,一是语义向量无法完全表示整个序列的信息,二是先输入的内容携带的信息会被后输入 的信息稀释掉。输入序列越长,这个现象就越严重。这就
相关文章
相关标签/搜索