RNN LSTM GRU Attention transformer公式整理总结(超详细图文公式)

整理各种模型的公式,以后面试复习用 RNN 公式: h t = f ( W ⋅ [ h t − 1 , x t ] + b ) h_{t}=f\left(W \cdot\left[h_{t-1}, x_{t}\right]+b\right) ht​=f(W⋅[ht−1​,xt​]+b) LSTM 公式: 遗忘门: f t = σ ( W f ⋅ [ h t − 1 , x t ] + b f )
相关文章
相关标签/搜索