文本特征提取方法研究

1、课题背景概述 文本挖掘是一门交叉性学科,涉及数据挖掘、机器学习、模式识别、人工智能、统计学、计算机语言学、计算机网络技术、信息学等多个领域。文本挖掘就是从大量的文档中发现隐含知识和模式的一种方法和工具,它从数据挖掘发展而来,但与传统的数据挖掘又有许多不一样。文本挖掘的对象是海量、异构、分布的文档(web);文档内容是人类所使用的天然语言,缺少计算机可理解的语义。传统数据挖掘所处理的数据是结构化
相关文章
相关标签/搜索