RNN之LSTM

参考 长短期记忆(Long short-term memory, LSTM)是一种特殊的RNN,主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。 LSTM的基本输入输出 如图所示,不同于普通的RNN,LSTM有两个传递状态,分别为 c t 和 h t c^t和h^t ct和ht,其中c变化缓慢,而h变化可以很大。 z i , z f , z o , z 四 个 状 态 z^i,z^f,z^
相关文章
相关标签/搜索