RNN LSTM GRU Attention transformer公式整理总结（超详细图文公式）

时间 2021-01-12

原文原文链接

整理各种模型的公式，以后面试复习用 RNN 公式： h t = f ( W ⋅ [ h t − 1 , x t ] + b ) h_{t}=f\left(W \cdot\left[h_{t-1}, x_{t}\right]+b\right) ht=f(W⋅[ht−1,xt]+b) LSTM 公式：遗忘门： f t = σ ( W f ⋅ [ h t − 1 , x t ] + b f )