看了这篇你还不懂BERT,那你就过来打死我吧

  目录 1. Word Embedding. 1 1.1 基于共现矩阵的词向量... 1 1.2 基于语言模型的词向量... 2 2. RNN/LSTM/GRU.. 5 2.1 RNN.. 5 2.2 LSTM 通过门的机制来避免梯度消失... 6 2.3 GRU 把遗忘门和输入门合并成一个更新门... 6 3. seq2seq模型... 8 3.1 朴素的seq2seq模型... 8 3.2
相关文章
相关标签/搜索