暑假周进度总结(4)

本周学习了第三章:分布式文件系统HDFS分布式

经过本章的学习:我知道分布式文件系统HDFS其是由不少廉价机器组成,而且其分为名称结点和数据结点,名称结点存储元数据,而数据结点存储文件的内容,名称结点是主结点,数据结点是从结点。HDFS有不少的优良特性,如廉价兼容的硬件设备(机房中的廉价机器)、流数据读写、大数据集、简单的文件模型、强大的跨平台兼容性,同时也有不少的局限性:不适合低延迟数据访问、没法高效存储大量小文件、不支持多用户写入及任意修改文件。HDFS有两个重要的文件:Fsimage和Editlog,Fsimage包含文件系统全部目录和其余信息,Editlog记录文件进行的一些增删改查的操做,而且这些文件都有不少个备份,分布存储在不一样的机器上,因此HDFS就实现了廉价机器的应用,即便某一台机器坏了,其上边的文件在其余的机器上还有不少的备份,一样能够找到此文件。学习

HDFS的存储原理能够对冗余数据保存,并能容易检查数据错误、保证数据可靠性、加快数据传输速度。还提供数据的存放和获取的方法,并能对数据的错误进行修改和恢复。大数据

相关文章
相关标签/搜索