数据挖掘
又称从数据中挖掘知识
、知识提取
、数据/模式分析
、数据考古和数据捕捞数据库
日益增加的数据同其中能获得的知识量的矛盾。数据愈来愈多,就迫切须要从数据中提取信息的工具。简单讲就是从数据中挖掘知识
。工具
数据挖掘就是从数据中发现知识的过程。
知识发现过程由如下步骤的迭代序列组成:spa
数据清理
(消除噪声和删除不一致数据)数据集成
(多种数据源能够组合在一块儿)数据选择
(从数据库中提取和分析任务相关的数据)数据变换
(经过汇总或汇集操做,把数据变换和统一成适合挖掘的形式)数据挖掘
(基本步骤,使用智能化方法提取数据模式)模式评估
(根据某种兴趣度度量,识别表明知识的真正有趣的模式)知识表示
(使用可视化和知识表示技术,向用户提供数据挖掘的知识)广义的数据挖掘的观点:数据挖掘是从大量数据中挖掘有趣模式和知识的过程。
3d
数据挖掘任务能够分为两类:
1.描述性
:描述性挖掘任务刻画目标数据中数据的通常性质
2.预测性
:预测性挖掘任务在当前数据上进行概括,以便作出预测code