hive的distribute by应用

hive的distribute by应用 博客分类:  hive   hive中的distribute by是控制在map端如何拆分数据给reduce端的。 hive会根据distribute by后面列,根据reduce的个数进行数据分发,默认是采用hash算法。算法 对于distribute by进行测试,必定要分配多reduce进行处理,不然没法看到distribute by的效果。jsp
相关文章
相关标签/搜索