6. 文本分类——transformer模型

文章目录 一、简介 二、transformer结构 三、用于文本分类的transformer 1. embedding layer(嵌入层) 2. positional encoding(位置编码) 3. Scaled dot-product attention(缩放的点乘注意力机制) 4. Multi-head attention(多头注意力) 5. Padding mask 6. 残差连接 7
相关文章
相关标签/搜索