对LSTM中每个batch都初始化隐含层的理解

时间 2021-07-01

原文原文链接

不知道有没有人和我有一样疑惑在LSTM相关的代码中，为什么每个batch都会将隐藏层重新初始化，这样不会把以前训练出来的参数丢掉吗？？比如代码来自GitHub 看了一些解释是h与c是状态，不是参数，每个batch中都需要初始化为0，LSTM 中的参数是W,b。网络中训练的是参数，不是状态。说真的。。。当时我没怎么看懂。。。咨询了实验室的师兄后，我有了自己的理解产生误解的主要原

>>阅读原文<<