【面试必备】硬核!30 张图解 HTTP 常见的面试题

每日一句英语学习,天天进步一点点:

前言

在面试过程当中,HTTP 被提问的几率仍是比较高的。小林我搜集了 5 大类 HTTP 面试常问的题目,同时这 5 大类题跟 HTTP 的发展和演变关联性是比较大的,经过问答 + 图解的形式由浅入深的方式帮助你们进一步的学习和理解 HTTP 。css

  1. HTTP 基本概念
  2. Get 与 Post
  3. HTTP 特性
  4. HTTPS 与 HTTP
  5. HTTP/1.一、HTTP/二、HTTP/3 演变
提纲提纲

正文

01 HTTP 基本概念

HTTP 是什么?描述一下html

HTTP 是超文本传输协议,也就是HyperText Transfer Protocol。web

可否详细解释「超文本传输协议」?面试

HTTP的名字「超文本协议传输」,它能够拆成三个部分:算法

  • 超文本
  • 传输
  • 协议
三个部分三个部分

1. 「协议」shell

在生活中,咱们也能随处可见「协议」,例如:后端

  • 刚毕业时会签一个「三方协议」;
  • 找房子时会签一个「租房协议」;
三方协议和租房协议三方协议和租房协议

生活中的协议,本质上与计算机中的协议是相同的,协议的特色:浏览器

  • 」字,表明的意思是必须有两个以上的参与者。例如三方协议里的参与者有三个:你、公司、学校三个;租房协议里的参与者有两个:你和房东。
  • 」字,表明的意思是对参与者的一种行为约定和规范。例如三方协议里规定试用期期限、毁约金等;租房协议里规定租期期限、每个月租金金额、违约如何处理等。

针对 HTTP 协议,咱们能够这么理解。缓存

HTTP 是一个用在计算机世界里的协议。它使用计算机可以理解的语言确立了一种计算机之间交流通讯的规范(两个以上的参与者),以及相关的各类控制和错误处理方式(行为约定和规范)。安全

2. 「传输」

所谓的「传输」,很好理解,就是把一堆东西从 A 点搬到 B 点,或者从 B 点 搬到 A 点。

别轻视了这个简单的动做,它至少包含两项重要的信息。

HTTP 协议是一个双向协议

咱们在上网冲浪时,浏览器是请求方 A ,百度网站就是应答方 B。双方约定用 HTTP 协议来通讯,因而浏览器把请求数据发送给网站,网站再把一些数据返回给浏览器,最后由浏览器渲染在屏幕,就能够看到图片、视频了。

请求 - 应答请求 - 应答

数据虽然是在 A 和 B 之间传输,但容许中间有中转或接力

就好像第一排的同窗想穿递纸条给最后一排的同窗,那么传递的过程当中就须要通过好多个同窗(中间人),这样的传输方式就从「A < --- > B」,变成了「A <-> N <-> M <-> B」。

而在 HTTP 里,须要中间人听从 HTTP 协议,只要不打扰基本的数据传输,就能够添加任意额外的东西。

针对传输,咱们能够进一步理解了 HTTP。

HTTP 是一个在计算机世界里专门用来在两点之间传输数据的约定和规范。

3. 「超文本」

HTTP 传输的内容是「超文本」。

咱们先来理解「文本」,在互联网早期的时候只是简单的字符文字,但如今「文本」。的涵义已经能够扩展为图片、视频、压缩包等,在 HTTP 眼里这些都算作「文本」。

再来理解「超文本」,它就是超越了普通文本的文本,它是文字、图片、视频等的混合体最关键有超连接,能从一个超文本跳转到另一个超文本。

HTML 就是最多见的超文本了,它自己知识纯文字文件,但内部用不少标签订义了图片、视频等的连接,在通过浏览器的解释,呈现给咱们的就是一个文字、有画面的网页了。

OK,通过了对 HTTP 里这三个名词的详细解释,就能够给出比「超文本传输协议」这七个字更准确更有技术含量的答案:

HTTP 是一个在计算机世界里专门在「两点」之间「传输」文字、图片、音频、视频等「超文本」数据的「约定和规范」。

那「HTTP 是用于从互联网服务器传输超文本到本地浏览器的协议HTTP」 ,这种说法正确吗?

这种说法是不正确的。由于也能够是「服务器< -- >服务器」,因此采用两点之间的描述会更准确。

HTTP 常见的状态码,有哪些?

 五大类 HTTP 状态码 五大类 HTTP 状态码

1xx

1xx 类状态码属于提示信息,是协议处理中的一种中间状态,实际用到的比较少。

2xx

2xx 类状态码表示服务器成功处理了客户端的请求,也是咱们最愿意看到的状态。

200 OK」是最多见的成功状态码,表示一切正常。若是是非 HEAD 请求,服务器返回的响应头都会有 body 数据。

204 No Content」也是常见的成功状态码,与 200 OK 基本相同,但响应头没有 body 数据。

206 Partial Content」是应用于 HTTP 分块下载或断电续传,表示响应返回的 body 数据并非资源的所有,而是其中的一部分,也是服务器处理成功的状态。

3xx

3xx 类状态码表示客户端请求的资源发送了变更,须要客户端用新的 URL 从新发送请求获取资源,也就是重定向

301 Moved Permanently」表示永久重定向,说明请求的资源已经不存在了,需改用新的 URL 再次访问。

302 Found」表示临时重定向,说明请求的资源还在,但暂时须要用另外一个 URL 来访问。

301 和 302 都会在响应头里使用字段 Location,指明后续要跳转的 URL,浏览器会自动重定向新的 URL。

304 Not Modified」不具备跳转的含义,表示资源未修改,重定向已存在的缓冲文件,也称缓存重定向,用于缓存控制。

4xx

4xx 类状态码表示客户端发送的报文有误,服务器没法处理,也就是错误码的含义。

400 Bad Request」表示客户端请求的报文有错误,但只是个笼统的错误。

403 Forbidden」表示服务器禁止访问资源,并非客户端的请求出错。

404 Not Found」表示请求的资源在服务器上不存在或未找到,因此没法提供给客户端。

5xx

5xx 类状态码表示客户端请求报文正确,可是服务器处理时内部发生了错误,属于服务器端的错误码。

500 Internal Server Error」与 400 类型,是个笼统通用的错误码,服务器发生了什么错误,咱们并不知道。

501 Not Implemented」表示客户端请求的功能还不支持,相似“即将开业,敬请期待”的意思。

502 Bad Gateway」一般是服务器做为网关或代理时返回的错误码,表示服务器自身工做正常,访问后端服务器发生了错误。

503 Service Unavailable」表示服务器当前很忙,暂时没法响应服务器,相似“网络服务正忙,请稍后重试”的意思。

http 常见字段有哪些?

Host

客户端发送请求时,用来指定服务器的域名。

Hostwww.A.com

有了 Host 字段,就能够将请求发往「同一台」服务器上的不一样网站。

Content-Length 字段

服务器在返回数据时,会有 Content-Length 字段,代表本次回应的数据长度。

Content-Length: 1000

如上面则是告诉浏览器,本次服务器回应的数据长度是 1000 个字节,后面的字节就属于下一个回应了。

Connection 字段

Connection 字段最经常使用于客户端要求服务器使用 TCP 持久链接,以便其余请求复用。

imageimage

HTTP/1.1 版本的默认链接都是持久链接,但为了兼容老版本的 HTTP,须要指定 Connection 首部字段的值为 Keep-Alive

Connection: keep-alive

一个能够复用的 TCP 链接就创建了,直到客户端或服务器主动关闭链接。可是,这不是标准字段。

Content-Type 字段

Content-Type 字段用于服务器回应时,告诉客户端,本次数据是什么格式。

Content-Type: text/html; charset=utf-8

上面的类型代表,发送的是网页,并且编码是UTF-8。

客户端请求的时候,可使用 Accept 字段声明本身能够接受哪些数据格式。

Accept: */*

上面代码中,客户端声明本身能够接受任何格式的数据。

Content-Encoding 字段

Content-Encoding 字段说明数据的压缩方法。表示服务器返回的数据使用了什么压缩格式

Content-Encoding: gzip

上面表示服务器返回的数据采用了 gzip 方式压缩,告知客户端须要用此方式解压。

客户端在请求时,用 Accept-Encoding 字段说明本身能够接受哪些压缩方法。

Accept-Encoding: gzip, deflate

GET 与 POST

说一下 GET 和 POST 的区别?

Get 方法的含义是请求从服务器获取资源,这个资源能够是静态的文本、页面、图片视频等。

好比,你打开个人文章,浏览器就会发送 GET 请求给服务器,服务器就会返回文章的全部文字及资源。

GET 请求GET 请求

POST 方法则是相反操做,它向 URI 指定的资源提交数据,数据就放在报文的 body 里。

好比,你在我文章底部,敲入了留言后点击「提交」(暗示大家留言),浏览器就会执行一次 POST 请求,把你的留言文字放进了报文 body 里,而后拼接好 POST 请求头,经过 TCP 协议发送给服务器。

POST 请求POST 请求

GET 和 POST 方法都是安全和幂等的吗?

先说明下安全和幂等的概念:

  • 在 HTTP 协议里,所谓的「安全」是指请求方法不会「破坏」服务器上的资源。
  • 所谓的「幂等」,意思是屡次执行相同的操做,结果都是「相同」的。

那么很明显 GET 方法就是安全且幂等的,由于它是「只读」操做,不管操做多少次,服务器上的数据都是安全的,且每次的结果都是相同的。

POST 由于是「新增或提交数据」的操做,会修改服务器上的资源,因此是不安全的,且屡次提交数据就会建立多个资源,因此不是幂等的。


03 HTTP 特性

你知道的 HTTP(1.1) 的优势有哪些,怎么体现的?

HTTP 最凸出的优势是「简单、灵活和易于扩展、应用普遍和跨平台」。

1. 简单

HTTP 基本的报文格式就是 header + body,头部信息也是 key-value 简单文本的形式,易于理解,下降了学习和使用的门槛。

2. 灵活和易于扩展

HTTP协议里的各种请求方法、URI/URL、状态码、头字段等每一个组成要求都没有被固定死,都容许开发人员自定义和扩充

同时 HTTP 因为是工做在应用层( OSI 第七层),则它下层能够随意变化

HTTPS 也就是在 HTTP 与 TCP 层之间增长了 SSL/TLS 安全传输层,HTTP/3 甚至把 TCPP 层换成了基于 UDP 的 QUIC。

3. 应用普遍和跨平台

互联网发展至今,HTTP 的应用范围很是的普遍,从台式机的浏览器到手机上的各类 APP,从看新闻、刷贴吧到购物、理财、吃鸡,HTTP 的应用片地开花,同时自然具备跨平台的优越性。

那它的缺点呢?

HTTP 协议里有优缺点一体的双刃剑,分别是「无状态、明文传输」,同时还有一大缺点「不安全」。

1. 无状态双刃剑

无状态的好处,由于服务器不会去记忆 HTTP 的状态,因此不须要额外的资源来记录状态信息,这能减轻服务器的负担,可以把更多的 CPU 和内存用来对外提供服务。

无状态的坏处,既然服务器没有记忆能力,它在完成有关联性的操做时会很是麻烦。

例如登陆->添加购物车->下单->结算->支付,这系列操做都要知道用户的身份才行。但服务器不知道这些请求是有关联的,每次都要问一遍身份信息。

这样每操做一次,都要验证信息,这样的购物体验还能愉快吗?别问,问就是酸爽

对于无状态的问题,解法方案有不少种,其中比较简单的方式用 Cookie 技术。

Cookie 经过在请求和响应报文中写入 Cookie 信息来控制客户端的状态。

至关于,在客户端第一次请求后,服务器会下发一个装有客户信息的「小贴纸」,后续客户端请求服务器的时候,带上「小贴纸」,服务器就能认得了了

Cookie 技术Cookie 技术

2. 明文传输双刃剑

明文意味着在传输过程当中的信息,是可方便阅读的,经过浏览器的 F12 控制台或 Wireshark 抓包均可以直接肉眼查看,为咱们调试工做带了极大的便利性。

可是这正是这样,HTTP 的全部信息都暴露在了光天化日下,至关于信息裸奔。在传输的漫长的过程当中,信息的内容都毫无隐私可言,很容易就能被窃取,若是里面有你的帐号密码信息,那你号没了

3. 不安全

HTTP 比较严重的缺点就是不安全:

  • 通讯使用明文(不加密),内容可能会被窃听。好比,帐号信息容易泄漏,那你号没了。
  • 不验证通讯方的身份,所以有可能遭遇假装。好比,访问假的淘宝、拼多多,那你钱没了。
  • 没法证实报文的完整性,因此有可能已遭篡改。好比,网页上植入垃圾广告,视觉污染,眼没了。

HTTP 的安全问题,能够用 HTTPS 的方式解决,也就是经过引入 SSL/TLS 层,使得在安全上达到了极致。

那你在说下 HTTP/1.1 的性能如何?

HTTP 协议是基于 TCP/IP,而且使用了「请求 - 应答」的通讯模式,因此性能的关键就在这两点里。

1. 长链接

早期 HTTP/1.0 性能上的一个很大的问题,那就是每发起一个请求,都要新建一次 TCP 链接(三次握手),并且是串行请求,作了无畏的 TCP 链接创建和断开,增长了通讯开销。

为了解决上述 TCP 链接问题,HTTP/1.1 提出了长链接的通讯方式,也叫持久链接。这种方式的好处在于减小了 TCP 链接的重复创建和断开所形成的额
外开销,减轻了服务器端的负载。

持久链接的特色是,只要任意一端没有明确提出断开链接,则保持 TCP 链接状态。

短链接与长链接短链接与长链接

2. 管道网络传输

HTTP/1.1 采用了长链接的方式,这使得管道(pipeline)网络传输成为了可能。

便可在同一个 TCP 链接里面,客户端能够发起多个请求,只要第一个请求发出去了,没必要等其回来,就能够发第二个请求出去,能够减小总体的响应时间。

举例来讲,客户端须要请求两个资源。之前的作法是,在同一个TCP链接里面,先发送 A 请求,而后等待服务器作出回应,收到后再发出 B 请求。管道机制则是容许浏览器同时发出 A 请求和 B 请求。

管道网络传输管道网络传输

可是服务器仍是按照顺序,先回应 A 请求,完成后再回应 B 请求。要是 前面的回应特别慢,后面就会有许多请求排队等着。这称为「队头堵塞」。

3. 队头阻塞

「请求 - 应答」的模式加重了 HTTP 的性能问题。

由于当顺序发送的请求序列中的一个请求由于某种缘由被阻塞时,在后面排队的全部请求也一同被阻塞了,会招致客户端一直请求不到数据,这也就是「队头阻塞」。比如上班的路上塞车

队头阻塞队头阻塞

总之 HTTP/1.1 的性能通常般,后续的 HTTP/2 和 HTTP/3 就是在优化 HTTP 的性能。


04 HTTP 与 HTTPS

HTTP 与 HTTPS 有哪些区别?

  1. HTTP 是超文本传输协议,信息是明文传输,存在安全风险的问题。HTTPS 则解决 HTTP 不安全的缺陷,在 TCP 和 HTTP 网络层之间加入了 SSL/TLS 安全协议,使得报文可以加密传输。
  2. HTTP 链接创建相对简单, TCP 三次握手以后即可进行 HTTP 的报文传输。而 HTTPS 在 TCP 三次握手以后,还需进行 SSL/TLS 的握手过程,才可进入加密报文传输。
  3. HTTP 的端口号是 80,HTTPS 的端口号是 443。
  4. HTTPS 协议须要向 CA(证书权威机构)申请数字证书,来保证服务器的身份是可信的。

HTTPS 解决了 HTTP 的哪些问题?

HTTP 因为是明文传输,因此安全上存在如下三个风险:

  • 窃听风险,好比通讯链路上能够获取通讯内容,用户号容易没。
  • 篡改风险,好比强制入垃圾广告,视觉污染,用户眼容易瞎。
  • 冒充风险,好比冒充淘宝网站,用户钱容易没。
HTTP 与 HTTPS 网络层HTTP 与 HTTPS 网络层

HTTPS 在 HTTP 与 TCP 层之间加入了 SSL/TLS 协议,能够很好的解决了上述的风险:

  • 信息加密:交互信息没法被窃取,但你的号会由于「自身忘记」帐号而没。
  • 校验机制:没法篡改通讯内容,篡改了就不能正常显示,但百度「竞价排名」依然能够搜索垃圾广告。
  • 身份证书:证实淘宝是真的淘宝网,但你的钱仍是会由于「剁手」而没。

可见,只要自身不作「恶」,SSL/TLS 协议是能保证通讯是安全的。

HTTPS 是如何解决上面的三个风险的?

  • 混合加密的方式实现信息的机密性,解决了窃听的风险。
  • 摘要算法的方式来实现完整性,它可以为数据生成独一无二的「指纹」,指纹用于校验数据的完整性,解决了篡改的风险。
  • 将服务器公钥放入到数字证书中,解决了冒充的风险。

1. 混合加密

经过混合加密的方式能够保证信息的机密性,解决了窃听的风险。

混合加密混合加密

HTTPS 采用的是对称加密非对称加密结合的「混合加密」方式:

  • 在通讯创建前采用非对称加密的方式交换「会话秘钥」,后续就再也不使用非对称加密。
  • 在通讯过程当中所有使用对称加密的「会话秘钥」的方式加密明文数据。

采用「混合加密」的方式的缘由:

  • 对称加密只使用一个密钥,运算速度快,密钥必须保密,没法作到安全的密钥交换。
  • 非对称加密使用两个密钥:公钥和私钥,公钥能够任意分发而私钥保密,解决了密钥交换问题但速度慢。

2. 摘要算法

摘要算法用来实现完整性,可以为数据生成独一无二的「指纹」,用于校验数据的完整性,解决了篡改的风险。

校验完整性校验完整性

客户端在发送明文以前会经过摘要算法算出明文的「指纹」,发送的时候把「指纹 + 明文」一同
加密成密文后,发送给服务器,服务器解密后,用相同的摘要算法算出发送过来的明文,经过比较客户端携带的「指纹」和当前算出的「指纹」作比较,若「指纹」相同,说明数据是完整的。

3. 数字证书

客户端先向服务器端索要公钥,而后用公钥加密信息,服务器收到密文后,用本身的私钥解密。

这就存在些问题,如何保证公钥不被篡改和信任度?

因此这里就须要借助第三方权威机构 CA (数字证书认证机构),将服务器公钥放在数字证书(由数字证书认证机构颁发)中,只要证书是可信的,公钥就是可信的。

数子证书工做流程数子证书工做流程

经过数字证书的方式保证服务器公钥的身份,解决冒充的风险。

HTTPS 是如何创建链接的?其间交互了什么?

SSL/TLS 协议基本流程:

  • 客户端向服务器索要并验证服务器的公钥。
  • 双方协商生产「会话秘钥」。
  • 双方采用「会话秘钥」进行加密通讯。

前两步也就是 SSL/TLS 的创建过程,也就是握手阶段。

SSL/TLS 的「握手阶段」涉及四次通讯,可见下图:

HTTPS 链接创建过程HTTPS 链接创建过程

SSL/TLS 协议创建的详细流程:

1. ClientHello

首先,由客户端向服务器发起加密通讯请求,也就是 ClientHello 请求。

在这一步,客户端主要向服务器发送如下信息:

(1)客户端支持的 SSL/TLS 协议版本,如 TLS 1.2 版本。

(2)客户端生产的随机数(Client Random),后面用于生产「会话秘钥」。

(3)客户端支持的密码套件列表,如 RSA 加密算法。

2. SeverHello

服务器收到客户端请求后,向客户端发出响应,也就是 SeverHello。服务器回应的内容有以下内容:

(1)确认 SSL/ TLS 协议版本,若是浏览器不支持,则关闭加密通讯。

(2)服务器生产的随机数(Server Random),后面用于生产「会话秘钥」。

(3)确认的密码套件列表,如 RSA 加密算法。

(4)服务器的数字证书。

3.客户端回应

客户端收到服务器的回应以后,首先经过浏览器或者操做系统中的 CA 公钥,确认服务器的数字证书的真实性。

若是证书没有问题,客户端会从数字证书中取出服务器的公钥,而后使用它加密报文,向服务器发送以下信息:

(1)一个随机数(pre-master key)。该随机数会被服务器公钥加密。

(2)加密通讯算法改变通知,表示随后的信息都将用「会话秘钥」加密通讯。

(3)客户端握手结束通知,表示客户端的握手阶段已经结束。这一项同时把以前全部内容的发生的数据作个摘要,用来供服务端校验。

上面第一项的随机数是整个握手阶段的第三个随机数,这样服务器和客户端就同时有三个随机数,接着就用双方协商的加密算法,各自生成本次通讯的「会话秘钥」。

4. 服务器的最后回应

服务器收到客户端的第三个随机数(pre-master key)以后,经过协商的加密算法,计算出本次通讯的「会话秘钥」。而后,向客户端发生最后的信息:

(1)加密通讯算法改变通知,表示随后的信息都将用「会话秘钥」加密通讯。

(2)服务器握手结束通知,表示服务器的握手阶段已经结束。这一项同时把以前全部内容的发生的数据作个摘要,用来供客户端校验。

至此,整个 SSL/TLS 的握手阶段所有结束。接下来,客户端与服务器进入加密通讯,就彻底是使用普通的 HTTP 协议,只不过用「会话秘钥」加密内容。


05 HTTP/1.一、HTTP/二、HTTP/3 演变

说说 HTTP/1.1 相比 HTTP/1.0 提升了什么性能?

HTTP/1.1 相比 HTTP/1.0 性能上的改进:

  • 使用 TCP 长链接的方式改善了 HTTP/1.0 短链接形成的性能开销。
  • 支持 管道(pipeline)网络传输,只要第一个请求发出去了,没必要等其回来,就能够发第二个请求出去,能够减小总体的响应时间。

但 HTTP/1.1 仍是有性能瓶颈:

  • 请求 / 响应头部(Header)未经压缩就发送,首部信息越多延迟越大。只能压缩 Body 的部分;
  • 发送冗长的首部。每次互相发送相同的首部形成的浪费较多;
  • 服务器是按请求的顺序响应的,若是服务器响应慢,会招致客户端一直请求不到数据,也就是队头阻塞;
  • 没有请求优先级控制;
  • 请求只能从客户端开始,服务器只能被动响应。

那上面的 HTTP/1.1 的性能瓶颈,HTTP/2 作了什么优化?

HTTP/2 协议是基于 HTTPS 的,因此 HTTP/2 的安全性也是有保障的。

那 HTTP/2 相比 HTTP/1.1 性能上的改进:

1. 头部压缩

HTTP/2 会压缩头(Header)若是你同时发出多个请求,他们的头是同样的或是类似的,那么,协议会帮你消除重复的分

这就是所谓的 HPACK 算法:在客户端和服务器同时维护一张头信息表,全部字段都会存入这个表,生成一个索引号,之后就不发送一样字段了,只发送索引号,这样就提升速度了。

2. 二进制格式

HTTP/2 再也不像 HTTP/1.1 里的纯文本形式的报文,而是全面采用了二进制格式,头信息和数据体都是二进制,而且统称为帧(frame):头信息帧和数据帧

报文区别报文区别

这样虽然对人不友好,可是对计算机很是友好,由于计算机只懂二进制,那么收到报文后,无需再将明文的报文转成二进制,而是直接解析二进制报文,这增长了数据传输的效率

3. 数据流

HTTP/2 的数据包不是按顺序发送的,同一个链接里面连续的数据包,可能属于不一样的回应。所以,必需要对数据包作标记,指出它属于哪一个回应。

每一个请求或回应的全部数据包,称为一个数据流(Stream)。每一个数据流都标记着一个独一无二的编号,其中规定客户端发出的数据流编号为奇数, 服务器发出的数据流编号为偶数

客户端还能够指定数据流的优先级。优先级高的请求,服务器就先响应该请求。

HTT/1 ~ HTTP/2HTT/1 ~ HTTP/2

4. 多路复用

HTTP/2 是能够在一个链接中并发多个请求或回应,而不用按照顺序一一对应

移除了 HTTP/1.1 中的串行请求,不须要排队等待,也就不会再出现「队头阻塞」问题,下降了延迟,大幅度提升了链接的利用率

举例来讲,在一个 TCP 链接里,服务器收到了客户端 A 和 B 的两个请求,若是发现 A 处理过程很是耗时,因而就回应 A 请求已经处理好的部分,接着回应 B 请求,完成后,再回应 A 请求剩下的部分。

多路复用多路复用

5. 服务器推送

HTTP/2 还在必定程度上改善了传统的「请求 - 应答」工做模式,服务再也不是被动地响应,也能够主动向客户端发送消息。

举例来讲,在浏览器刚请求 HTML 的时候,就提早把可能会用到的 JS、CSS 文件等静态资源主动发给客户端,减小延时的等待,也就是服务器推送(Server Push,也叫 Cache Push)。

HTTP/2 有哪些缺陷?HTTP/3 作了哪些优化?

HTTP/2 主要的问题在于,多个 HTTP 请求在复用一个 TCP 链接,下层的 TCP 协议是不知道有多少个 HTTP 请求的。因此一旦发生了丢包现象,就会触发 TCP 的重传机制,这样在一个 TCP 链接中的全部的 HTTP 请求都必须等待这个丢了的包被重传回来

  • HTTP/1.1 中的管道( pipeline)传输中若是有一个请求阻塞了,那么队列后请求也通通被阻塞住了
  • HTTP/2 多请求复用一个TCP链接,一旦发生丢包,就会阻塞住全部的 HTTP 请求。

这都是基于 TCP 传输层的问题,因此 HTTP/3 把 HTTP 下层的 TCP 协议改为了 UDP!

HTTP/1 ~ HTTP/3HTTP/1 ~ HTTP/3

UDP 发生是无论顺序,也无论丢包的,因此不会出现 HTTP/1.1 的队头阻塞 和 HTTP/2 的一个丢包所有重传问题。

你们都知道 UDP 是不可靠传输的,但基于 UDP 的 QUIC 协议 能够实现相似 TCP 的可靠性传输。

  • QUIC 有本身的一套机制能够保证传输的可靠性的。当某个流发生丢包时,只会阻塞这个流,其余流不会受到影响
  • TL3 升级成了最新的 1.3 版本,头部压缩算法也升级成了 QPack
  • HTTPS 要创建一个链接,要花费 6 次交互,先是创建三次握手,而后是 TLS/1.3 的三次握手。QUIC 直接把以往的 TCP 和 TLS/1.3 的 6 次交互合并成了 3 次,减小了交互次数
TCP HTTPS(TLS/1.3) 和 QUIC HTTPS TCP HTTPS(TLS/1.3) 和 QUIC HTTPS

因此, QUIC 是一个在 UDP 之上的 TCP + TLS + HTTP/2 的多路复用的协议。

QUIC 是新协议,对于不少网络设备,根本不知道什么是 QUIC,只会当作 UDP,这样会出现新的问题。因此 HTTP/3 如今普及的进度很是的缓慢,不知道将来 UDP 是否可以逆袭 TCP。


参考文献:

[1] 上野 宣.图解HTTP.人民邮电出版社.

[1] 罗剑锋.透视HTTP协议.极客时间.

[2] 陈皓.HTTP的前世今.酷壳CoolShell.https://coolshell.cn/articles/19840.html

[3] 阮一峰.HTTP 协议入门.阮一峰的网络日志.http://www.ruanyifeng.com/blog/2016/08/http.html


唠叨

本文的 22 张图片,都是从一条线两条线画出来,灰常的费劲,深切感觉到画图也是个体力活啊!

爱偷懒的我其实不爱画图,但为了让你们能更好的理解,在跟本身无数次斗争后,踏上了耗时耗体力的画图的不归路,但愿对大家有帮助!

创造不易啊,画图也不易,不想被白嫖哦,各位「三连」走起就是对小林创造的最大支持和动力了,咱们下次见!

相关文章
相关标签/搜索