Hive学习之抽样(Sampling)

      当数据量特别大时,对全体数据进行处理存在困难时,抽样就显得尤为重要了。抽样能够从被抽取的数据中估计和推断出总体的特性,是科学实验、质量检验、社会调查广泛采用的一种经济有效的工做和研究方法。java       Hive支持桶表抽样和块抽样,下面分别学习。所谓桶表指的是在建立表时使用CLUSTERED BY子句建立了桶的表。桶表抽样的语法以下:git table_sample: TABL
相关文章
相关标签/搜索