LSTM简单理解

RNN LSTM 长短期记忆(Long short-term memory, LSTM)是一种特殊的RNN,主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。简单来说,就是相比普通的RNN,LSTM能够在更长的序列中有更好的表现。 遗忘门 输入门 更新cell状态 输出门 LSTM怎么解决梯度消失和爆炸的问题? 首先三个门的激活函数是sigmoid,这也就意味着这三个门的输出要么接近于0,
相关文章
相关标签/搜索