python之nltk基础用法

一、NLTK进行分词 用到的函数: nltk.sent_tokenize(text) #对文本按照句子进行分割 nltk.word_tokenize(sent) #对句子进行分词 二、NLTK进行词性标注 用到的函数: nltk.pos_tag(tokens)#tokens是句子分词后的结果,同样是句子级的标注 三、NLTK进行命名实体识别(NER) 用到的函数: nltk.ne_chunk(ta
相关文章
相关标签/搜索