nltk基础用法

一、NLTK进行分词 用到的函数: nltk.sent_tokenize(text) #把文本分割成句子列表 nltk.word_tokenize(sent) #对句子进行分词 注意: 返回的都是句子或单词列表 二、NLTK进行词性标注 用到的函数: nltk.pos_tag(tokens) #tokens是句子分词后的结果,同样是句子级的标注 注意:每个单词都用一个元组表示了 三、NLTK进行命
相关文章
相关标签/搜索