set hive.cli.print.header=true; -- 显示字段名称 set hive.cli.print.current.db=true; -- 显示当前数据库名 drop database dbname CASCADE; -- 删除数据库及库中表 alter database dbname set dbproperties(key=value); -- 设置数据库元数据 alter table table_name set tblproperties('creator'='wangbin'); alter table table_name set tblproperties('EXTERNAL'='FALSE'); -- 注意大写的单词外部表转内部表 alter table table_name set serdeproperties('field.delim'='\t'); -- 修改序列化信息 alter table table_name partition(dt='') set fileformat sequencefile; -- 修改表的存储属性 alter table table_name partition(dt='') set location 'hdfs://...'; -- 修改表存储位置 insert overwrite directory 'hdfs://...' select * from table_name; -- 将查询数据导入到一个hdfs目录 order by --全局排序 sort by --局部(每一个reducer)排序 distribute by + 字段 --控制相同字段的map输出会发到一个reduce cluster by --等价于distribute by +sort by left semi join -- 左半链接,只返回左表中符合on条件的数据