Spark

一  为什么用SPARK 先进的大数据分布式编程和计算框架 试图代替HADOOP(SPARK可以独立于HADOOP) 内存分布式计算:运行速度快 可以用不同语言编程(JAVA,SCALA,R,PYTHON) 可以从不同的数据源取数据(HDFS,Cassandra,HBase) 实现不同的大数据功能:Spark Core,Spark SQL,Spark Streaming,Spark MLIB  以
相关文章
相关标签/搜索