Global Embedding 理解

时间 2021-01-11

原文原文链接

1.Attention-based seq2seq e(t,i)：求上一时刻的输出和这一时刻编码器的输出的相似度 a(t,i)：求这个词在整个文本中占多大的比重，每个时刻都存在着一个值，这个只是求一个softmax c(t)：文本向量，求和，n代表序列长度，每个词都有一个softmax值，用每一个概率值去乘以隐变量，这个隐变量就是最初的文本向量，这个概率值就是每个词在整个文本中占多大的比重，结果就