Global Embedding 理解

1.Attention-based seq2seq e(t,i):求上一时刻的输出和这一时刻编码器的输出的相似度 a(t,i):求这个词在整个文本中占多大的比重,每个时刻都存在着一个值,这个只是求一个softmax c(t):文本向量,求和,n代表序列长度,每个词都有一个softmax值,用每一个概率值去乘以隐变量,这个隐变量就是最初的文本向量,这个概率值就是每个词在整个文本中占多大的比重,结果就
相关文章
相关标签/搜索