

-
这些算法将现有数据(或过去的数据)基于其属性(属性)放入各类“类”(所以分类)中,并使用该分类数据进行预测。
-
这些算法基于现有数据元素构建数学模型,并使用该模型预测一个或多个数据元素主要用于数字,如利润,成本,房地产价值等。分类算法和回归算法之间的主要区别是回归算法中的输出类型预测数值,而分类算法预测“类标签”。
-
这些算法将数据划分为具备类似属性的项目的组或集群。
-
这些算法在现有数据中的不一样属性或属性之间找到一些关系(技术上称为关联),并尝试建立用于预测的“关联”规则。
算法在数据中查找常常一块儿出现的项目。
-
这些算法在数据中找到频繁的序列(例如:网站中的一系列点击,或者机器故障以前的一系列日志事件)。
-
这些算法相似于回归算法,由于它们预测数值,但时间序列集中于预测有序序列的将来值,而且还包含季节周期(例如:仓库库存管理)。
-
某些数据集可能包含许多变量,所以几乎不可能识别对预测有影响的重要变量。
降维算法有助于识别最重要的变量。
固然,还有许多其余算法,如随机森林,GBM,XBoost,GMM,核心近似等,选择用于特定分析任务的最佳算法多是一个挑战。
对于相同的业务问题,您可使用不一样的算法,每种算法产生不一样的结果,而某些算法能够产生多种类型的结果。
原文地址:算法
www.dataversity.net/10-most-pop…网站
论文地址:.net
www.cs.uvm.edu/~icdm/algor…
日志