吴恩达course5-序列模型学习笔记-很棒

https://www.jianshu.com/p/d67e01618dde   RNN结构 对于第一个单词的预测就是将x<1>送进网络,然后输出预测值ŷ<1>;对于第二个单词的预测,不仅接收x<2>,还接收来自第一个时间步长(time step,前面提到语言都是逐个生成的,包含时间的概念,所以会引入time step这个概念,也可以理解成:为逐个生成的单词都盖上专属的时间戳)的激活函数值a<1>
相关文章
相关标签/搜索