因为本身是统计专业的,而且最近作的项目里边涉及到了数据挖掘的知识点,因此就抽出时间来总结一下数据挖掘的知识点,若有不当之处但愿各位读者指正。算法
主要想讲一讲数据挖掘的概念以及关于数据的一些内容,相对来讲,理论内容偏多,但加深对这些东西的认识会让你在作数据挖掘时更有目的性。spa
定义:在大型数据存储库中,自动地发现有用信息的过程。.net
数据挖掘的通常过程包括如下这几个方面:3d
数据预处理blog
肯定数据集后,就开始对数据进行预处理使得数据可以为咱们所用了。包括数据清理、数据集成、数据规约和数据变换方法。get
数据挖掘it
一般进行的特征的构造而后放到特定的模型中去计算,利用某种标准去评判不一样模型或组合模型的表现,最后肯定一个最合适的模型用于咱们的后处理数据挖掘
后处理class
后处理的过程至关于咱们已经发现了那个咱们想要找到的模式,咱们会去应用它或者用合适的方式将其表示出来。方法
参考连接:https://blog.csdn.net/sinat_22594309/article/details/74923643