【互动问答分享】第17期决胜云计算大数据时代Spark亚太研究院公益大讲堂

时间 2019-11-07

标签互动问答分享决胜计算数据时代 spark 亚太研究院公益讲堂栏目 Spark 繁體版

原文原文链接

“决胜云计算大数据时代”oop

Spark亚太研究院100期公益大讲堂【第17期互动问答分享】性能

Q1：为了加快spark shuffle 的执行速度是否能够把spark_local_dirs 指向一块固态硬盘上面，这样作是否有效果。大数据

能够把spark_local_dirs指向一块固态硬盘上面,这样会很是有效的提高Spark执行速度；云计算
同时想更快的提高Spark运行速度的话能够指定多个Shuffle输出的目录，让Shuffle并行读写磁盘； spa

Q2：solidation=true只是在同一机器上进行合并对吧 hadoop

solidation=true是在同一台机器上进行合并；it
当进行合并的时候会把属于同一个Reducer的bucket放入同一个文件，这回极大的减小Shuffler文件的数量，提高性能； spark

Q3：将来spark与hadoop会共存吗io

Spark和hadoop会共存， Spark+Hadoop= A winning combination；并行
并存的时候，Hadoop主要使用HDFS进行数据存储，Spark负责对大数据一体化多元化的计算；

相关文章

相关标签/搜索

大数据----Spark

大数据时代

互动问答分享

云计算与大数据

决战大数据

Spark亚太研究院系列丛书

Docker命令大全

PHP 7 新特性

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公众号

欢迎关注本站公众号,获取更多信息

相关文章

>>更多相关文章<<