spark入门框架+python

简介: 不能否认,spark是一种大数据框架,它的出现每每会有Hadoop的身影,其实Hadoop更多的能够看作是大数据的基础设施,它自己提供了HDFS文件系统用于大数据的存储,固然还提供了MR用于大数据处理,可是MR有不少自身的缺点,针对这些缺点也已经有不少其余的方法,类如针对MR编写的复杂性有了Hive,针对MR的实时性差有了流处理Strom等等,spark设计也是针对MR功能的,它并无大数据
相关文章
相关标签/搜索