文本挖掘浅述

文本挖掘是一个融合了多学科的交叉领域,对文本挖掘的研究需要将自然语言处理、数据挖掘、信息检索、机器学习等众多领域的知识相结合。文本挖掘是对大量文本信息源的内容进行预处理、特征提取等,转化为数据集合后,再进行结构分析、文本摘要、文本分类、文本聚类、关联分析等,最后将可视化的结果反馈给用户,供用户浏览、查询。文本挖掘的一般处理过程如下图所示。(简言之:文本挖掘就是从大量的文本信息中提炼出高效的信息,并
相关文章
相关标签/搜索