hive-随机取样

转自 http://daizj.iteye.com/blog/2273426算法 http://lxw1234.com/archives/2015/08/444.htm app 0-Random sampling         使用RAND()函数和LIMIT关键字来获取样例数据。 使用DISTRIBUTE和SORT关键字来保证数据是随机分散到mapper和reducer的。ORDER BY R
相关文章
相关标签/搜索