LSTM反向传播算法 (基于矩阵求导的方法)

如下图所示(图片来自网络)。LSTM的核心思想是使得细胞状态Ct-1通过传送带,只经过少量的交互就输出Ct ,这使得之前的信息能够传递到当前,解决了RNN误差后向传播的梯度消失问题。 它与RNN一样,参数是共享。如下图所示,这三个LSTM细胞的参数是相同的,不同的是输入值不同,因此输出值Ht和Ct也不同。 对应的数学模型为 如果我们使用随机梯度下降法对网络进行优化,则输入数据和输出数据是逐个到来的
相关文章
相关标签/搜索