自然语言处理(九)——数据平滑

一、概念 什么是数据平滑?我通过一个例子来解释一下。假设有如下语料库: {   今天 天气 不错,   天气 晴朗,   晴朗 的 天气, } 如果要计算句子s=“晴朗天气”的概率(用二元语法模型,自然语言处理(七)已经介绍过),有如下计算过程。 p(天气 | 晴朗)  = c(晴朗天气)/ c(晴朗)  =  = 0 显然上面计算得到的概率不怎么准确,晴朗天气总有出现的可能,最起码概率应该大于0
相关文章
相关标签/搜索