对于hadoop生态圈的理解

大数据,首先你要能存的下大数据。程序员 传统的文件系统是单机的,不能横跨不一样的机器。HDFS(Hadoop Distributed FileSystem)的设计本质上是为了大量的数据能横跨成百上千台机器,可是你看到的是一个文件系统而不是不少文件系统。好比你说我要获取/hdfs/tmp/file1的数据,你引用的是一个文件路径,可是实际的数据存放在不少不一样的机器上。你做为用户,不须要知道这些,就
相关文章
相关标签/搜索