LSTM及其变体(一)

经典LSTM(1997) 1. 三个门的信息流入 ft=σ(Wf⋅[ht−1,xt]+bf) (1) it=σ(Wi⋅[ht−1,xt]+bi) (2) ot=σ(Wo⋅[ht−1,xt]+bo) (3) 2. 记忆单元的更新 C~t=tanh(WC⋅[ht−1,xt]+bC) (输入整流器) Ct=ft∗Ct−1+it∗C~t (记忆遗忘+输入整流) 3. 隐单元更新 ht=ot∗tanh(Ct
相关文章
相关标签/搜索