吴军《数学之美》部分概念笔记(1-11章)

相关参考资料见正文数据库 Good-turing模型:less 因为咱们是估算对于一个位置上出现单词wi的几率。这种状况下,在样本库中没有出现的单词,其几率并不是为0. 但因为已有的Nr`r的累计和已经达到了1,因此必须采用一个“腾挪“的办法,将一部分的几率分布腾挪给未出现的单词。编码 解决办法就是在计算累计出现次数较少的单词时,将其几率替换为一个较小的值(此处的办法是将r替换为r‘)spa  r
相关文章
相关标签/搜索