beam search

假设词表大小为3,内容为a,b,c。beam size是2 decoder解码的时候: 1: 生成第1个词的时候,选择概率最大的2个词,假设为a,c,概率分别为log(p(1_a)) log(p(1_c)) 那么当前序列就是a,c,对应的概率是 log(p1_0)=log(p(1_a)) log(p1_1)= log(p(1_c)) 2:生成第2个词的时候,假如当前对三个词的概率预测为
相关文章
相关标签/搜索