Spark的基本概念

2018年年底,开始spark学习 http://dblab.xmu.edu.cn/blog/1709-2/python 1  spark 涉及的名词解析 Block  输入可能以多个文件的形式存储在HDFS上,每一个File都包含了不少块,称为Block。学习 InuptSplit  当Spark读取这些文件做为输入时,会根据具体数据格式对应的InputFormat进行解析,通常是将若干个Blo
相关文章
相关标签/搜索