Hive读书笔记(Hadoop 生态系统)

Hive是构建在hadoop上的数据仓库工具,可以将结构化的数据文件映射为一张数据库表,也急速hi数据提取转化加载(ETL),并提供简单的SQL查询功能,称为HQL(这边要和Hibernate区别一下),允许熟悉SQL的用户查询数据。它是工作在thrift上的,控制分隔符也允许用户指定数据格式。 Hive的特点 支持索引,加快数据查询。 有不同的存储类型,如HBase中的文件、纯文本文件 将元数据
相关文章
相关标签/搜索