Hive设置map和reduce的个数

1、控制hive任务中的map数: 一般状况下,做业会经过input的目录产生一个或者多个map任务。 主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M, 可在hive中经过set dfs.block.size;命令查看到,该参数不能自定义修改);html 举例: a) 假设input目录下有1个文件a,大小为780M,那么hadoop会将该文
相关文章
相关标签/搜索