理解Transformer的三层境界(待续...)

文章目录 0x00、先导知识 0.1 Seq2Seq 0.2 Attention 0x01.第一层境界 高屋建瓴,会当凌绝顶 总结 0x02、第二层境界 由浅入深,由表及里,渐入佳境 宏观视角(A High-Level Look) 将张量引入图片(Bringing The Tensors Into The Picture) 开始“编码”(Now We’re Encoding! ) 从宏观视角看自注
相关文章
相关标签/搜索