企业使用Hadoop的重大挑战:如何在HDFS中组织和使用数据?

在上一章,我们研究了如何在MapReduce中使用不同的文件格式,以及哪些格式适合存储数据(往期文章请查看文末链接)。一旦熟练掌握了数据格式的概念和使用法则,就该思考如何在HDFS中组织数据了。在设计Hadoop系统时,企业应该尽早了解如何访问数据,以便优化将支持的重要用例,这一点非常重要。 本文作为《Hadoop从入门到精通》大型选题的第四章,主要讲解影响企业数据决策的几大因素,例如是否需要提供
相关文章
相关标签/搜索