1、前段时间由于导表需求(从一张表中查找出数据,按日期分区overwrite 到指定分区表中),在Hive里面研究了一下自动分区。node
步骤:sql
一、建好所需分区表函数
二、设置分区参数spa
set hive.exec.dynamic.partition=true;(可经过这个语句查看:set hive.exec.dynamic.partition;) set hive.exec.dynamic.partition.mode=nonstrict; SET hive.exec.max.dynamic.partitions=100000;(若是自动分区数大于这个参数,将会报错) SET hive.exec.max.dynamic.partitions.pernode=100000;
3、书写代码(特别注意:日期字段必定要放在末尾),例如:code
INSERT OVERWRITE TABLE dw_stage.ds_info_msg partition(cal_dt) select id ,... ,pv ,0 uv ,cal_dt from dw_stage.tiny_info_msg
2、若是要在partition字段用函数处理也可经过经过这种方式实现;例如:it
set hive.exec.dynamic.partition=true; set hive.exec.dynamic.partition.mode=nostrick; INSERT OVERWRITE TABLE dw_stage.ds_info_msg partition(cal_dt) SELECT id ,... ,pv ,date_sub('2014-03-23',7) cal_dt FROM dw_stage.tiny_info_msg07;