srilm语言模型中的平滑算法——Good-Turing平滑算法

最近使用使用python自己写的语言模型和srilm得到的语言模型做对比,srilm里还是有很多trick的,尤其是平滑算法,集成了很多数据平滑算法,研究的时候,记录一下。 在srilm中有回退和差值两类平滑算法,简单来说,回退就是将出现过的ngram的概率打个折扣,将那部分折扣下来的概率均摊为未出现的ngram作为他们的概率,而插值呢,一样是对出现过的ngram打折扣,但是折扣下来的概率值均摊到
相关文章
相关标签/搜索