hive 的map数和reduce如何肯定

1、    控制hive任务中的map数:  1.    一般状况下,做业会经过input的目录产生一个或者多个map任务。  主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M, 可在hive中经过set dfs.block.size;命令查看到,该参数不能自定义修改); 2.    举例:  a)    假设input目录下有1个文件a,大小
相关文章
相关标签/搜索