【机器学习】【seq2seq模型与attention机制,Beam Search】

Beam Search一张图来表示 贪心的做法:每次选择输出概率最大的那个单词,但是这样无法保证最终整体概率最大;而集束搜索每次会选择Beam个概率最大的单词(Beam表示每次选择单词数,本例中为3),然后进行下一步...直到最后会得到Beam个句子,挑出概率最大的那句就可以了。 seq2seq模型依赖于encode和decode两个模块。encoder用于对输入序列编码,decorder则是解码
相关文章
相关标签/搜索