HDFS原理篇

HDFS: 为什么出现:一台机器不能存储下所有的数据 是什么:分布式存储文件系统 特点:高容错性(多备份)       批处理(移动计算,而不是移动数据;数据暴露给计算框架)   适合大数据处理(可也达到10K+节点)   流式文件(一次写入,多次读取;不可修改原有文件)   构建在廉价的机器上(多副本,高容错)   提高了磁盘的利用率(如果不切片进行存储,那么当需要拉去数据时,只能从该节点拉去数
相关文章
相关标签/搜索