文本挖掘的基本过程

什么是文本挖掘 从文本数据中获取新发现的过程 文本挖掘也是一个非结构到结构化的过程。它是多方技术的一个综合。 文本挖掘的框架 文本数据源的获取,好比电子文档 数据预处理,将数据进行整合 文本清理 经常使用方法有:停词去除、词干提取 词切分(Tokenization ) 词性标注(POS tagging) 句法解析(Syntactial Parsing) 句法主要分为组成语法和相关语法两类 信息提取
相关文章
相关标签/搜索