Spark 与 Mapreduce 对比(多进程、多线程)

多进程模型,多线程模型 Hadoop MapReduce采用了多进程模型,而Spark采用了多线程模型:   Apache Spark的高性能一定程度上取决于它采用的异步并发模型(这里指server/driver 端采用的模型),这与Hadoop 2.X(包括YARN和MapReduce)是一致的。   Hadoop 2.X自己实现了类似Actor的异步并发模型,实现方式是epoll+状态机,而A
相关文章
相关标签/搜索