轻量级分布式文件系统FastDFS

 

FastDFShtml

 

简介git

技术论坛: http://bbs.chinaunix.net/forum-240-1.htmlgithub

资源地址: https://sourceforge.net/projects/fastdfs/服务器

源码资源: https://github.com/happyfish100架构

 

FastDFS是一个开源的轻量级分布式文件系统,它对文件进行管理,功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题。特别适合以文件为载体的在线服务,如相册网站、视频网站等等。app

FastDFS为互联网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用FastDFS很容易搭建一套高性能的文件服务器集群提供文件上传、下载等服务。负载均衡

FastDFS服务端有两个角色:跟踪器(tracker)和存储节点(storage)。跟踪器主要作调度工做,在访问上起负载均衡的做用。分布式

存储节点存储文件,完成文件管理的全部功能:就是这样的存储、同步和提供存取接口,FastDFS同时对文件的metadata进行管理。所谓文件的meta data就是文件的相关属性,以键值对(key value)方式表示,如:width=1024,其中的key为width,value为1024。文件metadata是文件属性列表,能够包含多个键值对。性能

跟踪器和存储节点均可以由一台或多台服务器构成。跟踪器和存储节点中的服务器都可以随时增长或下线而不会影响线上服务。其中跟踪器中的全部服务器都是对等的,能够根据服务器的压力状况随时增长或减小。网站

为了支持大容量,存储节点(服务器)采用了分卷(或分组)的组织方式。存储系统由一个或多个卷组成,卷与卷之间的文件是相互独立的,全部卷的文件容量累加就是整个存储系统中的文件容量。一个卷能够由一台或多台存储服务器组成,一个卷下的存储服务器中的文件都是相同的,卷中的多台存储服务器起到了冗余备份和负载均衡的做用。

在卷中增长服务器时,同步已有的文件由系统自动完成,同步完成后,系统自动将新增服务器切换到线上提供服务。

当存储空间不足或即将耗尽时,能够动态添加卷。只须要增长一台或多台服务器,并将它们配置为一个新的卷,这样就扩大了存储系统的容量。

FastDFS中的文件标识分为两个部分:卷名和文件名,两者缺一不可。

 

架构图

 

 

 

上传流程

 

 

client询问tracker上传到的storage,不须要附加参数;

tracker返回一台可用的storage;

client直接和storage通信完成文件上传

 

下载流程

 

 

client询问tracker下载文件的storage,参数为文件标识(组名和文件名);

tracker返回一台可用的storage;

client直接和storage通信完成文件下载。

 

术语简介

Tracker Server:跟踪服务器,主要作调度工做,在访问上起负载均衡的做用。记录storage server的状态,是链接Client和Storage server的枢纽。

Storage Server:存储服务器,文件和meta data都保存到存储服务器上

group:组,也称为卷。同组内服务器上的文件是彻底相同的

文件标识:包括两部分:组名和文件名(包含路径)

meta data:文件相关属性,键值对(Key Value Pair)方式,如:width=1024,heigth=768

 

同步机制

同一组内的storage server之间是对等的,文件上传、删除等操做能够在任意一台storage server上进行;

文件同步只在同组内的storage server之间进行,采用push方式,即源服务器同步给目标服务器;

源头数据才须要同步,备份数据不须要再次同步,不然就构成环路了;

上述第二条规则有个例外,就是新增长一台storage server时,由已有的一台storage server将已有的全部数据(包括源头数据和备份数据)同步给该新增服务器

 

FastDFS运行时目录结构

 

Tracker Server目录

${base_path}

   |__data

   |     |__storage_groups.dat:存储分组信息

   |     |__storage_servers.dat:存储服务器列表

   |__logs

         |__trackerd.log:tracker server日志文件

 

Storage Server目录

${base_path}

   |__data

   |     |__.data_init_flag:当前storage server初始化信息

   |     |__storage_stat.dat:当前storage server统计信息

   |     |__sync:存放数据同步相关文件

   |     |     |__binlog.index:当前的binlog文件索引号

   |     |     |__binlog.###:存放更新操做记录(日志)

   |     |     |__${ip_addr}_${port}.mark:存放同步的完成状况

   |     |

   |     |__一级目录:256个存放数据文件的目录,如:00, 1F

   |           |__二级目录:256个存放数据文件的目录

   |__logs

         |__storaged.log:storage server日志文件

 

FastDFS和其余文件存储的简单对比

 

FastDFS和集中存储方式对比

 

FastDFS和mogileFS对比

 

 

相关文章
相关标签/搜索