如何用scikit-learn求TF-IDF

第一次在CSDN发博客,望有什么错误的话,但愿各位大牛指出 关于scikit-learn能够处理的文本类型 经过参考网站的内容是直接创建一维列表,列表中的内容都是已经被分好词的字符串,每一行的字符串称做相应行的 第几类文本,如 中文效果就是: corpus=["我 来到 北京 清华大学", #第一类文本切词后的结果,词之间以空格隔开                    "他 来到 了 网易 杭研
相关文章
相关标签/搜索