半夜睡不着,忽然想起最近在抓网络数据的时候,批量下载图片时的文件夹问题。好比:
https://img3.doubanio.com/img/celebrity/small/32214.jpg
https://img1.doubanio.com/view/movie_poster_cover/spst/public/p2443884789.webp
而这些图片文件的路径有不少是不一样的。也就是放在了不一样的文件目录下。我但愿下载下来的图片目录结构基本保持不变:
img/celebrity/small/32214.jpg
只是域名部分写成我本身的。
有了需求,就开始写代码。仍是用node来实现:
var fs = require("fs");
var url = require("url");
//根据传入的url,建立出该url中的path包含的全部文件夹
//dest是目标文件夹,新生成的文件夹会放在里面
function createDirAccordingToUrl(originurl, dest) {
var urlobj = url.parse(originurl);
//将path用"/"分割为数组
var dirs = urlobj.path.split('/');
var dir = dest;
//用for循环来实现
//由于开头和结尾不是文件夹,所以从1开始,并排除数组的最后一项,也就是文件名: xx.jpg
for (var i = 1; i < dirs.length - 1; i++) {
//每循环一次,就把文件夹层级往里进一步。
dir += "/" + dirs[i];
//判断是否存在,且是否为文件夹
if (fs.existsSync(dir) && fs.statSync(dir).isDirectory()) {
//若是该层文件夹存在,就继续判断下一层
} else {
console.log("文件夹不存在,建立:" + dir);
fs.mkdirSync(dir);
}
}
}
用法:
var URL = "http://192.168.0.110:8080/img/celebrity/medium/31577.jpg";
createDirAccordingOnUrl(URL, __dirname);
生成结果以下:

瞌睡终于来了。各位晚安。。。