Spark机器学习 Day2 快速理解机器学习

Spark机器学习 Day2

快速理解机器学习

有两个问题:编程

  1. 机器学习究竟是什么。
  2. 大数据机器学习究竟是什么。

机器学习究竟是什么

人正常思惟的过程是根据历史经验得出必定的规律,而后在当前状况下根据这种规律来预测当前的状况下该怎么作,这种过程就是一个机器学习的过程。机器学习

咱们能够发现,这个过程里有规律和当前的状况。规律就是模型,当前状况就是当前的数据,会根据当前的状况会根据不一样的规律来得出不一样的结论来驱动下一个行为,就是数据驱动的一种决策方式,这和咱们编程用的指令驱动方式是彻底不一样的。学习

机器学习是根据统计学的理论,得出影响咱们结果的几个变量,有应变量和自变量。大数据

例如想预测房价,会根据历史房价波动的因素,判断哪些会影响房价,得出一个房价模型,就会根据具体地方和具体时间来预测房价,机器学习也是从数据中得出某种模型的。spa

机器学习其实和人的决策过程是同样的。spark

大数据机器学习是什么

为何大数据机器学习特别重要,由于不管创建模型仍是得出结果都是数据驱动的过程,而数据驱动显然在大数据和分布的状况下数据面更多,得出的模型更为合理,当前状况若是有更多的数据,得出的结论会更准确。变量

因此大数据机器学习已经成为了业界的主流,有着很是普遍的应用。统计

欲知后事如何,且听下回分解!

DT大数据天天晚上20:00YY频道现场授课频道68917580经验

相关文章
相关标签/搜索