【深度之眼tensorflow2.0框架项目班】31.LSTM和GRU动图理解

原文地址     因为传统的RNN模块会受到短期记忆的影响,当序列过长的时候,靠前的信息很难传递到后边的时间步,因此,当我们使用RNN处理文本进行预测的时候,会遗漏很多重要信息,除此之外,当网络过长的时候,反向传播的过程中会出现梯度消失的问题,梯度消失以后,参数也就不会在更新。因此我们有了LSTM和GRU。     LSTM 和 GRU 是解决短时记忆问题的解决方案,它们具有称为“门”的内部机制,
相关文章
相关标签/搜索