第四课 kaggle天然语言处理

NLTK 天然语言处理库,自带语料库,词性分类库。要记得安装语料库。python import nltk nltk.download() Tokenize  拆句子,拆小正则表达式 英文分词数组 import nltk sentence = 'hello world' tokens = nltk.word_tokenize(sentence) tokens 社交语言的分词 表情符号须要用正则表达式
相关文章
相关标签/搜索