大数据离线批处理场景化解决方案----离线处理技术框架介绍

大数据离线批处理化解决方案 HDFS概述 • HDFS(Hadoop Distributed File System)基于Google发布的GFS论文设计开发。 • 其除具备其它分布式文件系统相同特性外,HDFS还有自己特有的特性: • 高容错性:认为硬件总是不可靠的。 • 高吞吐量:为大量数据访问的应用提供高吞吐量支持。 • 大文件存储:支持存储TB-PB级别的数据。 • 不适用场景: • 低时
相关文章
相关标签/搜索