古德-图灵估计

  古德-图灵估计可以解决n元语法模型(n-gram)中的数据的稀疏问题。主要的思想是把非零的n元语法的概率降低匀给一些低概率n元语法,以修改最大似然估计与真实概率之间的偏离。是实用比较多的平滑算法。                                      图:从左到右的变化:把一部分看得见的事件的概率匀给未看见的事件         以统计词典中的概率为例,来说明古德-图铃公式
相关文章
相关标签/搜索