LSTM详解

1 什么是LSTM 长短期记忆(Long short-term memory, LSTM)是一种特殊的RNN,主要是为了解决长序列训练过程中的梯度消失和梯度爆炸问题。简单来说,就是相比普通的RNN,LSTM能够在更长的序列中有更好的表现。 2 深入LSTM结构 下面具体对LSTM的内部结构来进行剖析。 下面开始进一步介绍这四个状态在LSTM内部的使用。(敲黑板) 下图是普通RNN公式: 下图是LS
相关文章
相关标签/搜索