众所周知(你不知也当你知),MongoDB
是以文档(Document
)组织数据的。除了经常使用于存储Json
数据,它也是能够存储普通文件的。咱们能够把一些文件以BSOON
的格式存入MongoDB
,十分方便,比较说图片、文本文件等。但MongoDB
的BSON Document
有大小限制,最大不能超过16MB
。这对咱们存储大文件是不方便的。还好,MongoDB
为咱们提供了GridFS
文件存储组件,让咱们能够存储超过16MB
的文件,小文件固然也能够了。接下来让咱们一块儿学习一下这个GridFS
存储。mongodb
GridFS
原理比较简单,就是把大文件拆成小文件来存储而已。当咱们存入一个文件时,默认使用集合fs.files
和fs.chunks
来存储文件。其中fs.files
存储的是文件的信息,fs.chunks
用来存放文件内容,以BSON
格式存放。docker
fs.files
的一条记录以下:数据库
{ "_id" : ObjectId("5ec6b44af3760d5999bd1c91"), "length" : NumberLong(1048576), "chunkSize" : 261120, "uploadDate" : ISODate("2020-05-21T17:03:06.217Z"), "filename" : "pkslow.txt", "metadata" : {} }
字段解释:json
_id
:主键ID;bash
length
:文件大小;微信
chunkSize
:chunk的大小,决定要分几个chunk来存放文件;学习
uploadDate
:文件上传时间;code
filename
:文件名;视频
metadata
:文件其它信息,能够自定义加上,这样有利于后续的检索和使用等。blog
fs.chunks
的一条记录以下:
{ "_id" : ObjectId("5ec6b44af3760d5999bd1c94"), "files_id" : ObjectId("5ec6b44af3760d5999bd1c91"), "n" : 2, "data" : { "$binary" : "xxxxxxxxx", "$type" : "00" } }
字段解释:
_id
:主键ID;
files_id
:所存内容对应的文件ID,能够看到与fs._id
的值是同样的;
n
:第几个chunk的索引,从0开始;
data
:文件内容;
从感观上看了两个集合的字段,相信你们基本知道GridFS
是怎么组织数据的了。当咱们存入一个文件时,若是文件较小,小于chunkSize
,则会把文件信息存入fs.files
,只有一条记录;文件内容会存入fs.chunks
,也只有一条记录。若是存的文件大于chunkSize
,也会在fs.files
生成一条记录,但在fs.chunks
中会生成多条记录来存放文件内容。以下图所示:
MongoDB
为咱们创建了相关索引,能够加速查询,如fs.files
的文件名和上传时间;fs.chunks
的文件ID和n。
讲了基本原理,咱们来实际操做一下,使用MongoDB
给咱们准备好的命令来作一些操做。固然,首先要有一个安装好的数据库,能够参考《用Docker安装一个MongoDB最新版玩玩》。
咱们都是使用mongofiles
命令进行操做的,须要指定比较多的参考,例以下面的命令用于列出全部文件:
mongofiles --username user --password 123456 --host 127.0.0.1 --port 27017 --authenticationDatabase admin --db testdb list
为了避免要每次都输入这么长的命令,咱们加个别名:
alias mf='mongofiles --username user --password 123456 --host 127.0.0.1 --port 27017 --authenticationDatabase admin --db testdb'
列出文件:
mf list
存入文件:存入的文件名与本地文件名同样。
mf put pksow.txt
读取文件:
mf get pkslow.txt
查找文件:
mf search pkslow
删除文件:
mf delete pkslow.txt
指定自定义文件名:
mf --local pkslow.txt put /com/pkslow.txt
发挥你的想象力,GridFS
能作的事不少,存图片、音频、视频等,有时咱们只想查看大文件的部份内容,也能方便实现。
注:本文使用的MongoDB
版本为4.2.1
。
欢迎访问南瓜慢说 www.pkslow.com获取更多精彩文章!
欢迎关注微信公众号<南瓜慢说>,将持续为你更新...
多读书,多分享;多写做,多整理。