Google File system文件系统,是在特别便宜的普通硬件设备上运行,它是一个面向大规模数据密集型运用的、可伸缩的分布式文件系统。服务器
与传统文件相比,它认为组件失效是很日常的事件,由于GFS包括几千台的廉价设备组装的存储机器,被不少的客服机访问,GFS的组件的质量不同、数量有多,全部的机器在任什么时候间都有可能出现故障,可是GFS拥有持续监测、错误监测、灾难冗余以及能够自动恢复的机制。传统文件是覆盖原有数据方式来修改,而GFS大多文件修改是在文件尾部追加。分布式
在存储文件时,GFS存储文件被分割成必定大小的chunk,建立chunk时,master服务器会给chunk一个独有的标识,并且每一个块会复制到多个服务器上,一般状况上会使用三个存储复制节点。master节点管理全部文件系统的元数据,但master服务器并非永久保存chunk服务器存有指定chunk的副本信息。它是在启动时,轮流地询问chunk服务器,用来获取信息,已保持自身信息是最新的。经过周期性的心跳来监测chunk服务器的状态。日志
若是chunk出现问题或硬盘坏了,master能够经过操做日志的重演把文件系统恢复到最近的状态。操做日志包含了关键元数据变动历史记录。进程
若是master服务器失效了,能够利用以前复制master服务器的全部操做日志和checkpoint文件,从新启动一个新的master的进程。事件
关于GFS的垃圾回收机制,我以为很是好,它不是当即删除,而是将待删除的文件名改成一个包含删除时间的隐含名字。只有将隐藏文件从名称空间删除,而会永久删除。ast
GFS运用到施工中,也是很是合适的。首先它的成本不高,它能够存储大量文件,就算有一台电脑坏了,数据也不会丢失,并且在施工中,不少文件须要重作,保存文件很容易与以前的弄混淆,尤为是过好久再找事,分不清那个是最新版本的,而GFS是在文件尾部缀加,一更改,文件就所有变成最新版本的。有时不当心删了重要文件,颇有可能找不回了,而GFS的垃圾回收,就算删除了,也可找到。因此我以为能够将GFS文件系统运用到工程中。垃圾回收