No.6大数据入门 | MR实践:文件分发方式-cacheArchive

上文我们介绍了两种分发文件方式,接下来我们介绍第三种:通过解压压缩包形式进行文件分发:其中white_list是以压缩包形式上传的,并且也是需要先上传至hdfs上,这里我们的压缩包如下: 将其上传至hdfs上: 3)-cacheArchive形式分发 map.py需要重新开发,对目录进行遍历并读取压缩包文件的内容: #!/usr/bin/python import os import sys
相关文章
相关标签/搜索