解决梯度消失梯度爆炸强力推荐的一个算法-----LSTM(长短时记忆神经网络)

LSTM(长短时记忆) 应为在简单的RNN(vanilla RNN结构)中存在时序过长时会导致梯度消散,梯度爆炸的问题,而长短时记忆LSTM就是解决vanilla RNN中的不足,可以有效的减少梯度消散问题。 LSTM 中引⼊了3个⻔,即遗忘⻔(input gate)、输入⻔(forget gate)和输出⻔(output gate),以及与隐藏状态形状相同的记忆细胞(某些⽂献把记忆细胞当成⼀种特
相关文章
相关标签/搜索