BigData————Spark

时间 2020-12-30

标签 spark 栏目大数据繁體版

原文原文链接

spark是一个快速的通用的集群计算平台。特点：快速：比hadoop快出100倍，hadoop框架mapreduce计算需要落地。map任务结束后将结果输出到磁盘或者hdfs，reduce从hdfs读取数据，计算结果又放到 hdfs上，涉及到i/o。同时shuffle机制也需要i/o，伴随数据迁移。耗费时间。 spark相对而言，将mapreduce的计算过程需要的数据尽量的放到内存，当达到一

>>阅读原文<<

1. BigData————Spark
2. BigData |述说Apache Spark
3. BigData
4. BigData————hdfs
5. BigData————小总结
6. BigData-13：Hive
7. BigData（八）：HDFS
8. BigData Reference Website
9. Oracle GoldenGate For BigData
10. bigdata-02-kafka
更多相关文章...
• TiDB数据库的应用场景 - NoSQL教程
• 使用Rxjava计算圆周率
• NewSQL-TiDB相关