我理解的RNN、LSTM的工作

最近看RNN和LSTM 的工作原理看了很多,也慢慢有了些体会。 先从输入输出介绍(大部分来自知乎) 例如这样一个数据集合,总共100条句子,每个句子20个词,每个词都由一个80维的向量表示。在lstm中,单个样本即单条句子输入下(shape是 [1 , 20, 80]),假如设定每一个time step的输入是一个词(当然这不一定,你也可以调成两个词或者更多个数的词),则在t0时刻是第一个时间步,
相关文章
相关标签/搜索