【数据挖掘导论】书籍小册(一)绪论

数据挖掘导论 一、绪论 数据仓库:一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持决策分析。 数据挖掘是数据库中知识发现(KDD)不可缺少的一部分,KDD是将未加工的数据转换为有用信息的整个过程。如图: 数据预处理:包括清洗数据以便消除噪声和重复的观测值,以及选择与当前数据挖掘任务相关的记录和特征。它是整个知识发现过程中最费力、最耗时的步骤。 后处理:将有效和有用的结果集放到决
相关文章
相关标签/搜索