百面深度学习 | 第二期:长短期记忆网络

“百面深度学习”系列连载 第二期 长短期记忆网络 引言 众所周知,循环神经网络面临着长期依赖问题,即:随着网络层数加深或输入序列长度变长,无法学习利用到先前的信息。为了解决这一问题,于 1997 年由 Sepp Hochreiter 等人提出了长短期记忆网络(Long Short Term Memory Network, LSTM)[1]。LSTM 不仅能够敏感的应对短期输入信息,还能够对有价值的
相关文章
相关标签/搜索