【spark2】【源码学习】【分区数】spark读取 hdfs/可分割/单个 的文件时是如何划分分区

前言 spark怎么知道读取的是本地文件还是hdfs的文件呢? 前面写过一篇博客【spark2的textFile()是怎么实例化各个不同的fs(FileSystem)】,主要是指【本地文件系统】和【hadoop文件系统】,我们看到源码里最后是根据文件路径url的scheme来判断的: file: LocalFileSystem hdfs: DistributeFileSystem 1、从Input
相关文章
相关标签/搜索