HQL排查数据倾斜

如果某个key下记录数远超其他key,在join或group的时候可能会导致某个reduce任务特别慢。本例子SQL如下:查询每个appid打开的次数,需要排除掉作弊的imei。 说明:表cheat_imei,7500万条,无大key,为作弊的imei。表imei_open_app,5亿6526万条,为每个imei打开的appid。该表中存在大key,md5imei=54bc0748b1c0fb4
相关文章
相关标签/搜索