数据挖掘(一):引论

数据挖掘又称从数据中挖掘知识知识提取数据/模式分析、数据考古和数据捕捞数据库

1. 为何进行数据挖掘?

日益增加的数据同其中能获得的知识量的矛盾。数据愈来愈多,就迫切须要从数据中提取信息的工具。简单讲就是从数据中挖掘知识工具

2. 什么是数据挖掘?

数据挖掘就是从数据中发现知识的过程。
知识发现过程由如下步骤的迭代序列组成:spa

  • 1.数据清理(消除噪声和删除不一致数据)
  • 2.数据集成(多种数据源能够组合在一块儿)
  • 3.数据选择(从数据库中提取和分析任务相关的数据)
  • 4.数据变换(经过汇总或汇集操做,把数据变换和统一成适合挖掘的形式)
  • 5.数据挖掘(基本步骤,使用智能化方法提取数据模式)
  • 6.模式评估(根据某种兴趣度度量,识别表明知识的真正有趣的模式)
  • 7.知识表示(使用可视化和知识表示技术,向用户提供数据挖掘的知识)

广义的数据挖掘的观点:
数据挖掘是从大量数据中挖掘有趣模式和知识的过程。3d

3. 能够挖掘什么类型的模式?

数据挖掘任务能够分为两类:
1.描述性:描述性挖掘任务刻画目标数据中数据的通常性质
2.预测性:预测性挖掘任务在当前数据上进行概括,以便作出预测code

clipboard.png

4. 使用什么技术?

clipboard.png

5. 数据挖掘的主要问题

  • 挖掘方法
  • 用户交互
  • 有效性与伸缩性
  • 数据类型的多样性
  • 数据挖掘与社会
相关文章
相关标签/搜索