【DL】长短期记忆网络(LSTM)

导航 LSTM原理 GRU原理 Seq2Seq架构 编码信息损失 参考资料 LSTM原理 一般RNN中仅有一个隐藏状态单元 h t h_t ht​,且不同时刻的隐藏状态单元的参数是共享的,这种结构导致了RNN存在长期依赖问题,只能对短期输入敏感. LSTM在普通RNN上加入了元胞状态单元 c t c_t ct​,在不同的时刻有着可变的连接权重, c t c_t ct​通过对 h t h_t ht​
相关文章
相关标签/搜索