初识hadoop 读hadoop权威指南(二)

这篇开始学习hadoop的hdfs        hdfs 是为以流式数据访问模式存储超大文件而设计的文件系统,不需要再高可靠性的昂贵的硬盘上运行,只需要在普通硬盘上就可以,hdfs不适合延迟率要求在毫秒级别的application。hdfs中的文件只有一个写入者,而且写操作总是在文件末尾。        概念 什么是流式数据?       流式数据就是数据不断地传输,实时处理的数据,也是封装成为
相关文章
相关标签/搜索