LSTM里梯度回流的理解

在写cs231n assignment3时,LSTM的backward中有这样的代码: 之因此用+=是由于原代码中的dh只提供了根据loss function求导提供的导数,但不包括由prev_h生成next_h过程的导数(这部分导数只能从尾到头求出来)。这也是for循环用 for i in reversed(range(T)): 的缘由,即从最后向前依次求,知道dh0求出为止。web
相关文章
相关标签/搜索