Hive初识

Hive 由Facebook开源用于解决海量结构化日志的数据统计 hive是基于hadoop的一个数据仓库工具,可以将结构化的数据文件映射成一张表,并提供类似sql查询功能 构架在Hadoop上的数据仓库: 使用hql作为查询接口 使用HDFS存储 使用mapreduce计算 本质是将hql转化成mapreduce程序 灵活性和扩展性比较好 适合离线数据处理 架构图: 面试必问 HQL | ---
相关文章
相关标签/搜索