Spark系列(一) 认识Spark

怀念看论文的日子~/ 打算写一个Spark系列,主要以Scala代码实现,请赐予我力量吧!!! Spark的特点 运行速度:Spark拥有DAG执行引擎,支持在内存中对数据进行迭代计算。官方提供的数据表明,如果数据由磁盘读取,速度是Hadoop MapReduce的10倍以上,如果数据从内存中读取,速度可以高达100多倍。 适用性强:能够读取HDFS、Cassandra、HBase、S3和Tech
相关文章
相关标签/搜索