QA(三): 复杂attention机制(coattention及bi-attention)

DCN-动态共同attention网络 两种模型都是类似的,不像前一篇文章介绍的soft attention机制,只是考虑query到context的attention 这里两篇论文都会考虑 query 到 context 和 context到query的attention 然后得到的attention回和原始的encoder向量进行作用,得到修正后的query和context的修正矩阵 然后这些
相关文章
相关标签/搜索