稀疏Attention

时间 2020-07-20

标签稀疏 attention 繁體版

原文原文链接

1. 模型 Self Attention是 O ( n 2 ) O(n^2) O(n2)的，那是由于它要对序列中的任意两个向量都要计算相关度，获得一个 n 2 n^2 n2大小的相关度矩阵：html 左边显示了注意力矩阵，右变显示了关联性，这代表每一个元素都跟序列内全部元素有关联。web 因此，若是要节省显存，加快计算速度，那么一个基本的思路就是减小关联性的计算，也就是认为每一个元素只跟序列内的一

>>阅读原文<<

1. 稀疏Attention
2. 稀疏
3. 稀疏数组
4. 稀疏表示
5. 【稀疏矩阵】
6. 稀疏矩阵
7. 稀疏表达
8. 稀疏训练
9. 稀疏3d卷积
10. 稀疏贴图 SparseTexture
更多相关文章...
• W3C词汇和术语表 - 网站建设指南