python数据挖掘实战笔记——文本挖掘(1):语料库构建

什么是文本挖掘 ?   文本挖掘是抽取有效、新颖、有用、可理解的、散布在文本文件中的有价值知识,而且利用这些知识更好地组织信息的过程。 1、搭建语料库 语料库:要进行文本分析的全部文档的集合。linux 须要用到的模块:os、os.path、codecs、pandas 代码以下:web import os import os.path import codecs import pandas fi
相关文章
相关标签/搜索