起源javascript
蒂姆·伯纳斯·李(Tim Berners-Lee)爵士(1955年出生于英国)是万维网的发明者,互联网之父。css
1989 年,欧洲核子研究组织(CERN)的蒂姆·博纳斯-李(Tim Berners-Lee)博士提出一个构想:借助多文档之间相互关联造成的超文本(HyperText),连成可参阅的 WWW(World Wide Web,万维网),以帮助远隔两地的研究者们共享知识。在这个构想中,他提出了 3 项 WWW 构建的关键技术:HTML, URI, HTTP.html
互联网之父:蒂姆·伯纳斯·李(Tim Berners-Lee)、温顿·瑟夫(Vint Cerf 原名:Vinton Gray "Vint" Cerf )、罗伯特·卡恩(Robert Elliot Kahn)等。java
@Tim Berners-Lee算法
HTTP 0.9json
1989年 Tim Berners-Lee 蒂姆·伯纳斯-李在其论文中确立了:浏览器
1. URI:统一资源标识符 2. HTML:超文本标记语言 3. HTTP:超文本传输协议
这个版本的 HTTP 只容许 Get 方法。缓存
HTTP 1.0安全
1996年正式发布服务器
此时的 HTTP/1.0 还只是一份参考文档,不是正式标准
HTTP 1.1
1999年 HTTP/1.1 发布 RFC 文档 2616,后面拆分红了 RFC7230
HTTP/1.1 优缺点
HTTP 2
2015年 RFC-7540,起初叫作 SPDY 协议
HTTP 2.0 经过头压缩、分帧、二进制编码、多路复用等技术提高性能;
面临的问题:主要市场仍是在1.1的时代,普及率比较低。
使用 TCP 存在的问题:创建链接耗时(1.5RTT); 进行TLS链接耗时(1-2RTT); TCP的队头阻塞并无完全解决(丢包重传)
HTTP 3
目前还没正式发布,是有 Google 发起的心协议,叫作 QUIC 协议,在2018年,互联网标准化组织 IETF 将 HTTP over QUIC 更名为 HTTP 3.
QUIC 协议经过基于 UDP 自定义的相似 TCP 的链接、重试、多路复用、流量控制技术,进一步提高性能。
从古至今实时数据传输(音频、视频、游戏等)都面临卡顿、延迟等问题,而 QUIC 基于 UDP 的架构和改进的重传等特性,可以有效的提高用户体验。
目前 B站 也已经接入 QUIC。
HTTPS
HTTPS 协议(HyperText Transfer Protocol over Secure Socket Layer):通常理解为 HTTP+SSL/TLS,经过 SSL 证书来验证服务器的身份,并为浏览器和服务器之间的通讯进行加密。
由网景公司(Netscape)在1994年首次提出,随后扩展到互联网上。
在2000年代末至2010年代初,HTTPS开始普遍使用,以确保各种型的网页真实,保护帐户和保持用户通讯,身份和网络浏览的私密性。
那么SSL又是什么?
SSL(Secure Socket Layer,安全套接字层):1994年为 Netscape 所研发,SSL 协议位于 TCP/IP 协议与各类应用层协议之间,为数据通信提供安全支持。
TLS(Transport Layer Security,传输层安全):其前身是 SSL,它最初的几个版本(SSL 1.0、SSL 2.0、SSL 3.0)由网景公司开发,1999年从 3.1 开始被 IETF 标准化并更名,发展至今已经有 TLS 1.0、TLS 1.一、TLS 1.2 三个版本。
SSL3.0和TLS1.0因为存在安全漏洞,已经不多被使用到。TLS 1.3 改动会比较大,目前还在草案阶段,目前使用最普遍的是TLS 1.一、TLS 1.2。
SSL发展史(互联网加密通讯)
在 HTTP/1.1 最新标准 RFC7230 中,是这么定义 HTTP 的:
The Hypertext Transfer Protocol (HTTP) is a stateless application-level request/response protocol that uses extensible semantics and self-descriptive message payloads for flexible integration with network-based hypertext information systems.HTTP 协议是一种无状态的、处于应用层的、以请求/应答方式运行的协议,使用可扩展的语义和自描述的信息格式,与基于网络的超文本信息系统灵活的相互做用。
关键词:无状态、引用层、请求/应答、可扩展的语义、自描述、超文本
OSI 概念模型
OSI(Open System Interconnection Reference Model),开放式系统互联通讯参考模型,也就是咱们常说的 7 层模型。从它的名称就能够看出来,OSI 只是一个供参考的概念模型,它从未被真正的实现。
TCP/IP 模型
OSI 只是一个概念模型,而日常工做咱们最经常使用的仍是 TCP/IP 模型。TCP/IP 模型其实就是 OSI 模型的简化版本,也就是咱们平时所说的 4 层模型。
@ TCP/IP 四层模型
其实 TCP/IP 模型与 OSI 模型十分类似,主要是省略了表示层、会话层与物理层的实现。
下面是一张 OSI 模型与 TCP/IP 模型的层级对照图,你们能够经过对照图来总结 TCP/IP 模型中各层的职责。
@ OSI 七层模型与 TCP/IP 四层模型对比图
请求报文
GET / HTTP/1.1 Host: 127.0.0.1:9090 Connection: keep-alive Accept-Language: zh-CN,zh;q=0.9,en;q=0.8
@ HTTP 请求报文
响应报文
HTTP/1.1 200 ok Connection: keep-alive Content-Length: 164 Content-Type: text/html Date: Sat, 06 Jun 2020 01:53:57 GMT <html> ...
@ HTTP 响应报文
HTTP 协议的无状态与持久链接
一般,为了保存状态,服务器发送的响应报文中会有一个 Set-Cookie 的首部字段,客户端获取到该报文后,就能够保存 Cookie。下一次请求时,客户端会将保存的 Cookie 携带在请求报文中发送给服务器,服务器拿到 Cookie 后进行比对,就能够知道是从哪一个客户端发来的请求了。
@ 携带 Cookie 的 HTTP 传输过程
HTTP的实体数据-内容协商
“多用途互联网邮件扩展”(Multipurpose Internet Mail Extensions),简称为 MIME。
Accept 是客户端可接受的 MIME type,对应的是响应报文里 Content-Type。
Content-type:
Accept-Encoding: 该字段标记的是客户端支持的压缩格式
Content-Encoding:
对应客户端支持的语言和响应的语言类型:
type-subtype:en-US 美式英语、en-GB 英式英语、zh-CN 汉语
1. 数据类型表示实体数据的内容是什么,使用的是 MIME type,相关的头字段是 Accept 和 Content-Type; 2. 数据编码表示实体数据的压缩方式,相关的头字段是 Accept-Encoding 和 Content-Encoding; 3. 语言类型表示实体数据的天然语言,相关的头字段是 Accept-Language 和 Content-Language; 4. 字符集表示实体数据的编码方式,相关的头字段是 Accept-Charset 和 Content-Type; 5. 客户端须要在请求头里使用 Accept 等头字段与服务器进行“内容协商”,要求服务器返回最合适的数据; 6. Accept 等头字段能够用“,”顺序列出多个可能的选项,还能够用“;q=”参数来精确指定权重。
bytes & Content-Range: bytes 0-31/96
Transfer-Encoding: chunked 分块传输的编码规则:
“Transfer-Encoding: chunked”和“Content-Length”这两个字段是互斥的,也就是说响应报文里这两个字段不能同时出现,一个响应报文的传输要么是长度已知,要么是长度未知(chunked)。
Cookie属性
HTTP/1.1 200 Set-Cookie: key=value, Max-Age=10; Expires=Fri, 08-Jun-22 08:19:00 GMT; Domain=www.example.com; Path=/; HttpOnly; SameSite=Strict;
Expires和Max-Age都能控制Cookie的有效期,可是浏览器会优先采用 Max-Age计算有效期;
HttpOnly => 防范XSS(跨站脚本)攻击
在 JS 脚本里能够用 document.cookie 来读写 Cookie 数据,这就带来了安全隐患,有可能会致使“跨站脚本”(XSS)攻击窃取数据。 属性 “HttpOnly” 会告诉浏览器,此 Cookie 只能经过浏览器 HTTP 协议传输,禁止其余方式访问,浏览器的 JS 引擎就会禁用 document.cookie 等一切相关的 API,脚本攻击也就无从谈起了。
SameSite => 防范XSRF(跨站请求伪造)攻击
缓存控制头
HTTP/1.1 200 Cache-Control: max-age=30, no-store, no-cache, must-revalidate, proxy-revalidate, public
条件请求
If-Modified-Since: Mon, 27 Jul 2020 10:53:40 GMT If-None-Match: W/"5f1eb234-b7e"
条件请求的两个字段须要配合 ETag 和 Last-modified 才能起效,在第一次请求的时候,服务器返回上面两个字段;再次请求资源的时候,浏览器会带上这两个资源,使用 If-modified-since 和 If-none-Match 来验证资源是否过时。若是服务器返回 304 则读取浏览器的缓存文件。
[1] 极客时间 - 《趣谈网络协议》