有很多小伙伴在实际工做中,对于如何存储文件(图片、视频、音频等)没有一个很好的解决思路。都明白不能将文件存储在单台服务器的磁盘上,也知道须要将文件进行副本备份。若是本身手动写文件的副本机制,那就太麻烦了,这会涉及冗余副本机制、服务器的调度、副本检测、服务器节点检测、文件副本存放策略、网络环境检测等等一系列的难题。了解Hadoop的小伙伴,会天然而然的想到HDFS,没错,HDFS能够存储文件,也可以将大文件切分红一个个文件块进行存储,还可以根据配置自动提供冗余副本机制,不用咱们本身去处理复杂的冗余副本机制,也不用处理服务器的调度、副本检测、服务器节点检测、文件副本存放策略、网络环境检测等等一系列的难题。不过,HDFS适合存储大文件,缘由是文件的元数据信息所有存储在NameNode节点中,若是使用HDFS大量的存储小文件,则会使NameNode的内存占用率迅速上升,NameNode节点会成为整个集群环境的瓶颈。html
基于种种缘由的考虑,今天,我为你们推荐一款高性能的分布式文件系统——FastDFS,FastDFS一样可以提供冗余副本机制,也可以处理上述所说的种种问题。很少说了,咱们进入主题吧。java
跟踪服务器: 192.168.50.131 (liuyazhuang131)
存储服务器: 192.168.50.132 (liuyazhuang132)
环境: CentOS 6.5
用户: root
数据目录: /fastdfs (注: 数据目录按你的数据盘挂载路径而定)nginx
安装包:c++
源码地址: https://github.com/happyfish100/
下载地址: http://sourceforge.net/projects/fastdfs/files/
官方论坛: http://bbs.chinaunix.net/forum-240-1.htmlgit
# yum install make cmake gcc gcc-c++
(1)上传或下载 libfastcommon-master.zip 到/usr/local/src 目录github
(2)解压vim
# cd /usr/local/src/ # unzip libfastcommon-master.zip # cd libfastcommon-master
(3) 编译、安装浏览器
# ./make.sh # ./make.sh install
libfastcommon 默认安装到了以下位置。bash
/usr/lib64/libfastcommon.so /usr/lib64/libfdfsclient.so
(4)由于 FastDFS 主程序设置的 lib 目录是/usr/local/lib, 因此须要建立软连接服务器
# ln -s /usr/lib64/libfastcommon.so /usr/local/lib/libfastcommon.so # ln -s /usr/lib64/libfastcommon.so /usr/lib/libfastcommon.so # ln -s /usr/lib64/libfdfsclient.so /usr/local/lib/libfdfsclient.so # ln -s /usr/lib64/libfdfsclient.so /usr/lib/libfdfsclient.so
(1)上传或下载 FastDFS 源码包(FastDFS_v5.05.tar.gz) 到 /usr/local/src 目录
(2)解压
# cd /usr/local/src/ # tar -zxvf FastDFS_v5.05.tar.gz # cd FastDFS
(3)编译、 安装(编译前要确保已经成功安装了 libfastcommon)
# ./make.sh # ./make.sh install
采用默认安装的方式安装,安装后的相应文件与目录:
A、 服务脚本在:
/etc/init.d/fdfs_storaged /etc/init.d/fdfs_tracker
B、 配置文件在(样例配置文件)
/etc/fdfs/client.conf.sample /etc/fdfs/storage.conf.sample /etc/fdfs/tracker.conf.sample
C、 命令工具在/usr/bin/目录下的
fdfs_appender_test fdfs_appender_test1 fdfs_append_file fdfs_crc32 fdfs_delete_file fdfs_download_file fdfs_file_info fdfs_monitor fdfs_storaged fdfs_test fdfs_test1 fdfs_trackerd fdfs_upload_appender fdfs_upload_file stop.sh restart.sh
(4)由于 FastDFS 服务脚本设置的 bin 目录是/usr/local/bin, 但实际命令安装在/usr/bin, 能够进入/user/bin 目录使用如下命令查看 fdfs 的相关命令:
# cd /usr/bin/ # ls | grep fdfs
所以须要修改 FastDFS 服务脚本中相应的命令路径,也就是把/etc/init.d/fdfs_storaged和/etc/init.d/fdfs_trackerd 两个脚本中的/usr/local/bin 修改为/usr/bin:
# vi fdfs_trackerd
使用查找替换命令进统一修改:%s+/usr/local/bin+/usr/bin
# vi fdfs_storaged
使用查找替换命令进统一修改:%s+/usr/local/bin+/usr/bin
注:使用查找替换命令为进入vi / vim编辑器,按下esc键,输入冒号(:),再输入%s+/usr/local/bin+/usr/bin便可把全部的/usr/local/bin修改成/usr/bin
复制 FastDFS 跟踪器样例配置文件,并重命名:
# cd /etc/fdfs/
# cp tracker.conf.sample tracker.conf
# vi /etc/fdfs/tracker.conf
修改的内容以下:
disabled=false port=22122 base_path=/fastdfs/tracker
(其它参数保留默认配置, 具体配置解释请参考官方文档说明:http://bbs.chinaunix.net/thread-1941456-1-1.html )
# mkdir -p /fastdfs/tracker
# vi /etc/sysconfig/iptables
添加以下端口行:
-A INPUT -m state --state NEW -m tcp -p tcp --dport 22122 -j ACCEPT
重启防火墙
# service iptables restart
# /etc/init.d/fdfs_trackerd start
(初次成功启动,会在/fastdfs/tracker 目录下建立 data、 logs 两个目录)
查看 FastDFS Tracker 是否已成功启动。
# ps -ef | grep fdfs
# /etc/init.d/fdfs_trackerd stop
# vi /etc/rc.d/rc.local
添加如下内容
## FastDFS Tracker /etc/init.d/fdfs_trackerd start
复制 FastDFS 存储器样例配置文件,并重命名
# cd /etc/fdfs/
# cp storage.conf.sample storage.conf
# vi /etc/fdfs/storage.conf
修改的内容以下:
disabled=false port=23000 base_path=/fastdfs/storage store_path0=/fastdfs/storage tracker_server=192.168.50.131:22122 http.server_port=8888
(其它参数保留默认配置, 具体配置解释请参考官方文档说明:http://bbs.chinaunix.net/thread-1941456-1-1.html )
# mkdir -p /fastdfs/storage
# vi /etc/sysconfig/iptables
添加以下端口行:
-A INPUT -m state --state NEW -m tcp -p tcp --dport 23000 -j ACCEPT
重启防火墙:
# service iptables restart
# /etc/init.d/fdfs_storaged start
(初次成功启动,会在/fastdfs/storage 目录下建立 data、 logs 两个目录)
查看 FastDFS Storage 是否已成功启动
# ps -ef | grep fdfs
# /etc/init.d/fdfs_storaged stop
# vi /etc/rc.d/rc.local
添加:
## FastDFS Storage /etc/init.d/fdfs_storaged start
# cp /etc/fdfs/client.conf.sample /etc/fdfs/client.conf # vi /etc/fdfs/client.conf base_path=/fastdfs/tracker tracker_server=192.168.50.131:22122
# /usr/bin/fdfs_upload_file /etc/fdfs/client.conf /usr/local/src/FastDFS_v5.05.tar.gz
返回 ID 号: group1/M00/00/00/wKgEfVUYNYeAb7XFAAVFOL7FJU4.tar.gz(能返回以上文件 ID, 说明文件上传成功)
FastDFS 经过 Tracker 服务器,将文件放在 Storage 服务器存储, 可是同组存储服务器之间须要进入文件复制, 有同步延迟的问题。假设 Tracker 服务器将文件上传到了 192.168.50.132,上传成功后文件 ID已经返回给客户端。此时 FastDFS 存储集群机制会将这个文件同步到同组存储 192.168.50.133,在文件尚未复制完成的状况下,客户端若是用这个文件 ID 在 192.168.50.133 上取文件,就会出现文件没法访问的错误。而 fastdfs-nginx-module 能够重定向文件链接到源服务器取文件,避免客户端因为复制延迟致使的文件没法访问错误。(解压后的 fastdfs-nginx-module 在 nginx 安装时使用)
# cd /usr/local/src/ # tar -zxvf fastdfs-nginx-module_v1.16.tar.gz
# cd fastdfs-nginx-module/src # vi config CORE_INCS="$CORE_INCS /usr/local/include/fastdfs /usr/local/include/fastcommon/" 修改成: CORE_INCS="$CORE_INCS /usr/include/fastdfs /usr/include/fastcommon/"
(注意: 这个路径修改是很重要的,否则在 nginx 编译的时候会报错的)
# yum install gcc gcc-c++ make automake autoconf libtool pcre* zlib openssl openssl-devel
# cd /usr/local/src/ # tar -zxvf nginx-1.13.0.tar.gz # cd nginx-1.13.0 # ./configure --add-module=/usr/local/src/fastdfs-nginx-module/src # make && make install
复制 fastdfs-nginx-module 源码中的配置文件到/etc/fdfs 目录, 并修改
# cp /usr/local/src/fastdfs-nginx-module/src/mod_fastdfs.conf /etc/fdfs/ # vi /etc/fdfs/mod_fastdfs.conf
修改如下配置:
connect_timeout=10 base_path=/tmp tracker_server=192.168.50.131:22122 storage_server_port=23000 group_name=group1 url_have_group_name = true store_path0=/fastdfs/storage
# cd /usr/local/src/FastDFS/conf # cp http.conf mime.types /etc/fdfs/
# ln -s /fastdfs/storage/data/ /fastdfs/storage/data/M00
简洁版 nginx 配置样例:
user root; worker_processes 1; events { worker_connections 1024; } http { include mime.types; default_type application/octet-stream; sendfile on; keepalive_timeout 65; server { listen 8888; server_name localhost; location ~/group([0-9])/M00 { #alias /fastdfs/storage/data; ngx_fastdfs_module; } error_page 500 502 503 504 /50x.html; location = /50x.html { root html; } } }
注意、 说明:
A、 8888 端口值是要与/etc/fdfs/storage.conf 中的 http.server_port=8888 相对应,由于 http.server_port 默认为 8888,若是想改为 80,则要对应修改过来。
B、 Storage 对应有多个 group 的状况下,访问路径带 group 名,如/group1/M00/00/00/xxx,对应的 Nginx 配置为:
location ~/group([0-9])/M00 { ngx_fastdfs_module; }
C、 如查下载时如发现老报 404, 将 nginx.conf 第一行 user nobody 修改成 user root 后从新启动。
# vi /etc/sysconfig/iptables
添加:
-A INPUT -m state --state NEW -m tcp -p tcp --dport 8888 -j ACCEPT
重启防火墙
# service iptables restart
# /usr/local/nginx/sbin/nginx
启动成功后会输入:
ngx_http_fastdfs_set pid=xxx
(重启 Nginx 的命令为: /usr/local/nginx/sbin/nginx -s reload)
http://192.168.50.132:8888/group1/M00/00/00/wKgyhFkWubGAcwrWAAVFOL7FJU4.tar.gz
注意: 千万不要使用 kill -9 命令强杀 FastDFS 进程,不然可能会致使 binlog 数据丢失。另外,你们能够到连接http://download.csdn.net/detail/l1028386804/9841444下载FastDFS_v5.05_安装包、工具包
好了,我们今天就聊到这儿吧!别忘了给个在看和转发,让更多的人看到,一块儿学习一块儿进步!!
若是以为文章对你有点帮助,请微信搜索并关注「 冰河技术 」微信公众号,跟冰河学习分布式存储技术。