【机器学习】【seq2seq模型与attention机制，Beam Search】

时间 2020-12-30

原文原文链接

Beam Search一张图来表示贪心的做法：每次选择输出概率最大的那个单词，但是这样无法保证最终整体概率最大；而集束搜索每次会选择Beam个概率最大的单词（Beam表示每次选择单词数，本例中为3），然后进行下一步...直到最后会得到Beam个句子，挑出概率最大的那句就可以了。 seq2seq模型依赖于encode和decode两个模块。encoder用于对输入序列编码，decorder则是解码

>>阅读原文<<