LSTM变种-GRU网络结构

简介 GRU是LSTM的一种变体,其将忘记门和输入门合成了一个单一的更新门。一样还混合了细胞状态和隐藏状态,加诸其余一些改动。最终的模型比标准的 LSTM 模型要简单,是很是流行的变体。 使用LSTM的缘由之一是解决RNN Deep Network的Gradient错误累积太多,以致于Gradient归零或者成为无穷大,因此没法继续进行优化的问题。GRU的构造更简单:比LSTM少一个gate,这样
相关文章
相关标签/搜索