nlp5-n-gram/语言模型(数据平滑方法

文章目录 1.句子的先验概率 1.1 n-gram 2. 参数估计 3. 数据平滑 3.1 数据平滑度方法 3.1.1加1法 3.1.2减 1.句子的先验概率 这个联合概率太小了 窗口越大,共现的可能性越小 参数多 解决:等价类 不看所有的历史信息 只看部分历史信息,但看所有的历史等价 如何划分等价类 将两个历史映射到同一个等价类,当且仅当这两个历史中的最近 n-1 个基元相同,即: 1.1 n-
相关文章
相关标签/搜索