Hive数据导入方案—使用ORC格式存储hive数据

目的:将上网日志导入到 hive中,要求速度快,压缩高,查询快,表易维护。推荐使用 ORC格式的表存储数据 思路:由于在 hive指定 RCFile格式的表,不能直接 load数据,只能经过 textfile表进行 insert转换。考虑先创建txtFile格式内部临时表 tmp_testp,使用 hdfs fs -put命令向 tmp_testp表路径拷贝数据(不是 load),再创建ORC格式
相关文章
相关标签/搜索