统计语言模型

1. 统计语言模型 句子 W=wT1=(w1,w2,⋯,wT),wT1 表示句子的第一个词语到第T个词语。 P(W)=P(wT1)=P(w1,w2,⋯,wT)=P(w1)×P(w2|w1)×P(w3|w21)×⋯×P(wT|wT1) 句子长度为 T,词典 D 的大小为 N ,存在 NT 种句子,每个句子需要 T 个参数,共 T×NT 个参数(其中有重复的)。 下面讨论两种计算参数的方法:n-gra
相关文章
相关标签/搜索