Attention机制的小理解

时间 2020-07-25

标签 attention 机制理解繁體版

原文原文链接

1.传统的encode-decode模型输入序列：函数输出序列：学习中间语义变量优化因此对于，也就是编码这就代表输入序列的每个元素对于输出序列的每个元素的做用是等价的，这显然是不合理的。好比机器翻译中，中文“我爱你”，对应英语中“I love you”。其中“我”对于“I”和“love”的翻译做用力显然不一样。为了解决这

>>阅读原文<<

最新文章

欢迎关注本站公众号,获取更多信息