Hive基本原理

基于Hadoop的一个数据仓库工具,本质上是一个翻译器,在hadoop基础上架设一层接口,使得可使用相似sql的hql语句来操做数据。web 主要特色:sql 分析离线数据,不具备实时性 不支持事务 不支持修改 有不少的数据冗余 Hive的存储结构:数据库 Hive的数据库实际上时HDFS文件系统中的 [库名].db 文件夹。 Hive数据库中的表,其实是库文件夹下的子文件夹。 Hive中表的数据
相关文章
相关标签/搜索