Attention

一、背景知识: 大致趋势: 1 本质:人类视觉感知场景时,不会从头到尾进行感知,而是根据观察注意特定的部分。 NLPattention计算方法: 本质可以被描述为一个查询(query)到一系列(键key-值value)对的映射 计算attention三步: 第一步:将query和每个key进行相似度计算得到权重。常用的相似度计算函数有:点积、拼接、感知机等。 第二步:使用softmax进行归一化
相关文章
相关标签/搜索