【大数据笔记04】Hive

概述 Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件 映射为一张数据库表,并提供类 SQL 查询功能。 本质是将 SQL 转换为 MapReduce 程序。 主要用途:用来做离线数据分析,比直接用 MapReduce 开发效率更高。 工作原理 RunJar(提交Job的客户端)向Yarn的RM(ResourceManager)申请运行本次应用的AppMaster。 RM
相关文章
相关标签/搜索