Hadoop学习总结之HDFS

简介 首先简单介绍一下HDFS。 HDFS的设计思想: 分而治之:将大文件、大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析;为各类分布式运算框架(如:mapreduce,spark等)提供数据存储服务。 HDFS的特性: 1) HDFS中的文件在物理上是分块存储(block),块的大小可以通过配置参数( dfs.blocksize)来规定,默认大小在hadoo
相关文章
相关标签/搜索