机器学习5. RNN/LSTM/GRU 反向传播公式推导;encoder-decoder框架/attention机制汇总

研究生期间主要科研的内容,把基本公式推一推。html encoder-decoder机制 核心:处理不定长数据时,先使用一个encoder模型(能够是任何模型,这里以RNN为例),将输入数据压缩成一个固定长度的隐表示 c c c。而后使用另外一个decoder模型依次展开隐表示 c c c获得咱们须要的内容。 应用举例: 文本翻译 问答系统 可是这样是有问题的,就是当输入很长的时候,把他们都压缩到
相关文章
相关标签/搜索