文本分析概述(数据挖掘)

文本分析概述 非结构化的数据通过向量空间模型转化为结构化的数据,并以表格的形式呈现,两种方式:分词算法与词频统计。 结构化数据:计算机能够识别处理的数据; 非结构化数据:视频、图形、图像、文本、语音等。 对表格中的词,进行特征选择,目的是降维,对文本进行向量净化处理之后,形成最具代表性的文本特征。 文本分析重要的研究内容 1、文本表示模型的选择 2、特征词选择算法 文本表示模型相关的方法和技术 1
相关文章
相关标签/搜索