《使用Python进行自然语言处理》学习笔记四

第二章 获得文本语料和词汇资源 2.2 条件频率分布 1条件和事件 频率分布计算观察到的事件,如文本中出现的词汇。条件频率分布需要给每个时间关联一个条件,所以不是处理一个词序列,我们必须处理的是一个配对序列。每对的形式是:(条件,事件) 。 2按文体计数词汇 FreqDist()以一个简单的链表作为输入,ConditionalFreqDist()以一个配对链表作为输入。 参见代码模块NltkTes
相关文章
相关标签/搜索