大数据技术原理与应用笔记(3)——分布式文件系统HDFS

分布式文件系统HDFS 大数据技术以及具有代表性的Hadoop平台,所要解决的最核心的两大问题是: 大数据的分布式存储 大数据的分布式处理 而HDFS(Hadoop Distributed File System)就是为了解决海量数据的分布式存储问题。 3.1 分布式文件系统 (1)计算机集群结构 分布式文件系统把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群。 与之前使用多个
相关文章
相关标签/搜索