基于NodeJS的HTTP server Plus 5:压缩(Accept-Encoding/Content-Encoding)

概述

在浏览器向服务器请求静态资源时,服务器为了减少在网络传输过程当中消耗的流量和时间,都是将静态资源通过压缩后返回给服务器的,实现压缩的算法有 deflategzip 等,最经常使用的是 gzip 压缩。html

gzip 简介

在浏览器和服务器之间经过 gzip 压缩流实现传输的过程能够用下图表示。算法


gzip 压缩工做原理

当浏览器向服务器请求静态资源,服务器会将静态资源通过处理转换为压缩流,大大减少文件体积,而后将压缩流返回给浏览器,浏览器经过压缩的类型从新将压缩流解析成静态文件。浏览器

zlib 模块的使用

一、压缩

在 NodeJS 中经过 zlib 模块帮助咱们实现不一样类型的压缩,其实压缩的过程就是建立流的过程,建立的压缩流是 Transform 类型(转化流),读取文件的内容通过转化流建立一个新类型的文件。bash

文件:gzip.js
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
复制代码
const zlib = require("zlib");
const fs = require("fs");
const path = require("path");

// 压缩
function gzip(source) {
    // 处理输入和输出的文件路径
    let sourcePath = path.join(__dirname, source);
    let gzipPath = `${sourcePath}.gz`;

    // 建立转化流
    let gzip = zlib.createGzip();

    // 建立可读流
    let rs = fs.createReadStream(sourcePath);

    // 建立可写流
    let ws = fs.createWriteStream(gzipPath);

    // 实现转化
    rs.pipe(gzip).pipe(ws);
}

gzip("index.html");
复制代码

执行上面代码查看根目路是否出现 index.gz 压缩包。服务器

二、解压

压缩的过程是可逆的,能够压缩就能够解压,不管是在浏览器仍是在服务器,咱们下面实现解压的方法。网络

文件:gunzip.js
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
复制代码
const zlib = require("zlib");
const fs = require("fs");
const path = require("path");

// 解压
function gunzip(source) {
    // 处理输入和输出的文件路径
    let sourcePath = path.join(__dirname, source);
    let filePath = path.join(__dirname, path.basename(source, ".gz"));

    // 建立转化流
    let unzip = zlib.createGunzip();

    // 建立可读流
    let rs = createReadStream(sourcePath);

    // 建立可写流
    let ws = createWriteStream(filePath);

    // 实现转化
    rs.pipe(unzip).pipe(ws);
}

gunzip("index.html.gz");
复制代码

删除原来 index.html,执行解压代码,查看文件根目录是否生成 index.html工具

服务器的实现

在浏览器与服务器的交互中,浏览器其实会经过请求头 Accept-Encoding 告诉服务器当前支持解压的压缩格式,值为 gzip, deflate, br,多个压缩格式用 , 隔开,服务器在接收到浏览器请求后,会按照请求头的格式压缩资源,将压缩后的资源返回,并经过响应头 Content-Encoding 告诉浏览器当前服务器压缩的格式。测试

文件:server.js
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
复制代码
// 引入依赖
const http = require("http");
const url = require("url");
const path = require("path");
const fs = require("fs");
const zlib = require("zlib");

// 建立服务器
const server = http.createServer((req, res) => {
    // 处理 pathname,"/" 时默认读取 "/index.html"
    let { pathname } = url.parse(req.url, true);
    pathname = pathname !== "/" ? pathname : "/index.html";

    // 获取读取文件的绝对路径
    let p = path.join(__dirname, pathname);

    // 查看路径是否合法
    fs.access(p, err => {
        // 路径不合法则直接中断链接
        if (err) return res.end("Not Found");

        // 获取浏览器支持的压缩格式
        let encoding = req.headers["accept-encoding"];

        // 建立可读流
        let rs = fs.createReadStream(p);

        // 支持 gzip 使用 gzip 压缩,支持 deflate 使用 deflate 压缩
        if (encoding && encoding.match(/\bgzip\b/)) {
            let compress = zlib.createGzip();
            let compressType = "gzip";
        } else if (encoding && encoding.match(/\bdeflate\b/)) {
            let compress = zlib.createDeflate();
            let compressType = "deflate";
        } else {
            // 不然直接返回可读流
            return rs.pipe(res);
        }

        // 将压缩流返回并设置响应头
        res.setHeader("Content-Encoding", compressType);
        rs.pipe(compress).pipe(res);
    });
});

server.listen(3000, () => {
    console.log("server start 3000");
});
复制代码

在上面服务器中若是不经过响应头通知浏览器当前资源的压缩格式,浏览器会不知道该如何解压,默认会当成文件下载,如 Chrome,因此在返回压缩流时必须经过 Content-Encoding 响应头通知浏览器当前的压缩格式。优化

测试服务器压缩

咱们在文件根目录建立一个 index.html 文件,代码以下。ui

文件:index.html
1
2
3
4
5
6
7
8
9
10
11
12
复制代码
<!DOCTYPE html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <meta http-equiv="X-UA-Compatible" content="ie=edge">
    <title>gzip</title>
</head>
<body>
    <div>Hello GZIP!</div>
</body>
</html>
复制代码

启动服务器 server.js,而后经过浏览器访问 localhost:3000,查看页面可否正确返回,并查看开发者工具 Network 中的响应头 Content-Encoding 的值是否正确。

总结

服务器压缩实际上是客户端与服务器在网络传输时的一种优化手段,能够大大减少流量的消耗和响应时间,而 gzip 只是目前最经常使用的一种压缩格式,即压缩算法。

原文出自:https://www.pandashen.com

相关文章
相关标签/搜索