spark数据分析引擎

简介 spark是专为大规模数据处理而设计的快速通用的计算引擎 . spark既可以批处理也可以做流式处理 spark运行速度比mapreduce快大约10倍 . 在机器学习 ,人工智能的逻辑回归迭代算法场景下spark运行速度比mapreduce大约快100多倍 . mapreduce在计算过程中涉及到本地磁盘的读写 , spark的数据流转都是在内存中完成的 . spark涉及到DAG(有向无
相关文章
相关标签/搜索