序列模型与注意力机制总结

时间 2020-12-30

原文原文链接

1.翻译即有条件的语言模型 2.1beam search 参数B 2.2 beam search 的概率表达式 2.3 在扩展一次 3.beam search 改进，修改评价函数为 log，同时做normalization时，增加一个超参。 4.Beam width B 5. 误差分析比较 beam search 跟 rnn 引起误差的比例 6.Bleu score 7.1注意力