第1章 大数据Spark概述

Spark概述 1.一、什么是Spark MR的缺点: mr基于数据集计算,因此面向数据web (1)基本运算规则从存储介质中获取(采集)数据,而后进行计算,最后将结果存储到介质中,因此主要应用于一次计算,不适合于数据挖掘和机器学习的迭代计算和图形挖掘计算。算法 (2)MR基于文件存储介质的操做,因此性能很是慢。架构 (3)MR和hadoop紧密耦合在一块儿,没法动态替换机器学习 Spark的历史
相关文章
相关标签/搜索