NLTK-003:词典资源

词典或者词典资源的意思是一个 词或短语 以及一些相关信息的集合。例如:词性和词意定义等相关信息。词典资源附属于文本,通常在文本的帮助下创建和丰富。 词汇列表语料库 nltk.corpus.words 仅仅包含词汇列表的语料库,可以用来寻找文本语料中不常见的或者拼写错误的词汇 import nltk def unusual_words(text): text_vocab = set([w.l
相关文章
相关标签/搜索