《Hadoop The Definitive Guide》ch14 Case Studies

1. Hivehtml hive是基于Hadoop的一个数据仓库工具,能够将结构化的数据文件映射为一张数据库表,并提供完整的sql查询功能,能够将sql语句转换为MapReduce任务进行运行。 其优势是学习成本低,能够经过类SQL语句快速实现简单的MapReduce统计,没必要开发专门的MapReduce应用,十分适合数据仓库的统计分析。 java 2. Nutchsql 参考:http://b
相关文章
相关标签/搜索