deeplearning.ai学习LSTM

时间 2019-12-12

标签 deeplearning.ai deeplearning 学习 lstm 繁體版

原文原文链接

1、LSTM架构与公式架构

这里的a<t>表示的就是原始输出，y<t>表示的就是通过softmax的输出，c<t>至关于状态。u(update)表明是输入门，f表明遗忘门，o(output)表明输出门。spa

上图就是串联起来的结构，从图中咱们能够看出，若是门控设置比较合理的话，c<0>从左到右是能够一直传递的，不管中间通过多少层，这就是LSTM能够处理长依赖的优点。blog

2、Bidirectional RNN(双向RNN结构)资源

上图就是andrew ng画的双向RNN的结构示意图，该结构仍是以序列标注的问题做为例子解释的。从图示能够看出，一个是从左到右计算a<1>--->a<2>--->a<3>--->a<4>，另外一个方向是从右向左计算a<4>--->a<3>--->a<2>--->a<1>，根据最终两个方向计算出来的a<t>来计算最终的输出y<t>。计算公式以下：io

上图每个节点cell能够是普通RNN结构，也能够是GRU或者LSTM。入门

3、Deep RNNdate

如图所示的深层RNN共有三层，RNN对于计算资源要求比较高，因此三层已经很多了，其各个节点a和输出值y计算以下：im

其中的每一个方框节点cell，一样能够是普通RNN，GRU或者LSTM.img