自然语言处理期末复习(1)n元模型

一、n元模型 1.语言建模:根据给定的语言样本估计概率P(s)的过程 2.语言模型:根据语言样本估计出的概率分布P称为语言L的语言模型。 3.马尔科夫假设:词wi 的出现只与其前n-1个词有关 4.n元组(n-gram):只需要考虑n个词组成的片段。(n越大,模型需要的参数越多,历史信息越多,模型越准确) 5.如何建立n元模型:确定训练语料、对预料进行分词、句子边界标记,增加两个特殊词。建立n元模
相关文章
相关标签/搜索