Hive-2.HiveQL查询中抽样查询

 当数据集很是大的时候,咱们须要找一个子集来加快数据分析。此时咱们须要数据采集工具以得到须要的子集。在此能够使用三种方式得到采样数据:random sampling, bucket sampling, block sampling。数组 8.1随机抽样(Random sampling )  使用RAND()函数和LIMIT关键字来获取样例数据,使用DISTRIBUTE和SORT关键字来保证数据是随
相关文章
相关标签/搜索