RNN激活函数、Encoder-Decoder、Seq2Seq、Attention

时间 2020-02-17

标签 rnn 激活函数 encoder decoder seq2seq seq attention 繁體版

原文原文链接

RNN中为何使用使用tanh激活，不用sigmoid、Relu Sigmoid函数的导数范围是(0,0.25], Tanh函数的导数是(0,1]。网络因为RNN中会执行不少累乘，小于1的小数累乘会致使梯度愈来愈接近于0,出现梯度消失现象。函数 Tanh与Sigmoid相比，梯度更大，收敛速度更快而且出现梯度消失的状况要优于Sigmoid。优化另外一点是Sigmoid的输出均大于0，不是

>>阅读原文<<

1. NLP—RNN、Seq2Seq和Attention
2. 激活函数（2）Softmax激活函数
3. 【NLP】图解从RNN到seq2seq+Attention
4. seq2seq入门详解：从RNN到Attention
5. 激活函数
更多相关文章...
• W3C XQuery 活动 - W3C 教程
• W3C Soap 活动 - W3C 教程
• Flink 数据传输及反压详解
• TiDB 在摩拜单车在线数据业务的应用和实践