【大数据】学习hdfs

HDFS是什么? Hadoop Distributed File System,它是一种分布式文件存储系统,主要解决大数据的存储问题。 HDFS的优缺点: 优点: 适合大数据处理 适合批处理 百万规模以上的文件数量:10K+ 节点 可以构建在廉价的机器上 高可靠性:通过多副本提高安全可靠性 高容错性:数据自动保存多个副本;副本丢失后,自动恢复,提供了恢复机制 缺点: 低延迟高数据吞吐访问问题:不支
相关文章
相关标签/搜索