python学习 文本特征提取(二) CountVectorizer TfidfVectorizer 中文处理

上一篇博客shuihupo 博客地址,https://blog.csdn.net/shuihupo/article/details/80923414 shuihupo对字典储存的的数据,咱们使用CountVectorizer对特征进行抽取和向量化。 在文本数据处理中,咱们遇到的常常是一个个字符串,且对于中文来讲,常常要处理没有分割符的大段最原始的字符串(这种数据须要先分词,转化为一个分割好的字符串
相关文章
相关标签/搜索