LSTM与GRU

很多博客已经详细讲述了lstm和gru的结构及公式,这里就不一一介绍了,参考下面链接,讲的挺详细 http://www.javashuo.com/article/p-uosezjcr-bs.html 这篇文章主要讲自己对lstm与gru的区别及联系的理解。 在传统RNN中,由于反向传播过程中出现激活函数的累乘,容易造成梯度消失和梯度爆炸,这就造成在较长的time-steps下,后面的step很难学
相关文章
相关标签/搜索