HTTP你可能还不知道的事。

时间 2019-11-08

原文原文链接

HTTP是一个基于TCP/IP通讯协议来传递数据的无状态协议，且其是一个属于应用层的面向对象的协议。说到应用层，引一下《计算机网络》里边的内容，在家没有翻到这本书才想起来给忘带了过来，真是后悔大学里没有把这些基础掌握扎实啊。（掌握一些基础知识有百益而无一害，并且计算机方面知识都是互通的，不分到具体某个领域，就像是《计算机基础》这本书，虽然说没有重要的知识要领掌握，但这是一本决定你层次高低的标杆，就是由于其内容不少涉及到计算机底层原理的知识）TCP/IP网络通讯模型总共分为四层以下所示：html

TCP/IP网络通讯模型
应用层-Application layer(HTTP，FTP，DNS...)
传输层-Transport layer (TCP，UDP，RTP...)
网络层-Internet layer (IP，ICMP，AKP...)
网络接入层-Link layer(IEEE 802.1A，FDDI，Ethernet...)

而HTTP就是基于其中应用层的一套协议，该层包括全部和应用程序协同工做，利用基础网络交换应用程序专用的数据的协议（来自维基百科），例如表格中列举的同样，感兴趣的同窗能够本身研究下，本篇主要讨论一下http协议。言归正传，HTTP协议工做在客户端-服务端之间，浏览器做为HTTP客户端经过URL向WEB服务器发送请求，服务器接收到来自客户端（浏览器）的请求后会返回响应信息，就是简单的“请求-应答”模式可是为何说http协议是无状态的？找了些资料大概是这样解释的：web

协议对于事务处理没有记忆能力
对同一个url请求没有上下文关系
每次的请求都是独立的，它的执行状况和结果与前面的请求和以后的请求是无直接关系的，它不会受前面的请求应答状况直接影响，也不会直接影响后面的请求应答状况
服务器中没有保存客户端的状态，客户端必须每次带上本身的状态去请求服务器浏览器

以上几点中的关键词已经加粗，作重点理解，这时能够抛出一个最恰当的问题：既然HTTP是无状态的，那keep-alive的值意义何在？其实keep-alive就是为了让客户端和服务端保持一种持久的链接联系，这样也是为了减小请求/响应的开销，提升性能，但这并不意味着请求头中有了这个参数，HTTP就不是无状态的协议了，其自己还是无状态的协议，并且无状态指的是在应用层这个层次上服务器没有保存客户端的状态信息，ok说到这里也是时候搞一搞cookie和session了，二者都是客户端和服务端通讯的介质，简而言之，cookie是客户端的存储空间，由浏览器来维持，其采用的是在客户端保持状态的方案，而session机制采用的是在服务器端保持状态的方案。有些时候因为服务器端保持状态的方案在客户端也须要保存一个标识，因此session机制可能须要借助于cookie机制来达到保存标识的目的。（近期作的一个项目让我意识到了本身的知识窄区例如session/http相关知识，之前只是知道并无深刻了解，我的以为在某些专业领域仍是要抛弃不求甚解的思想，有时候钻个牛角尖也会有额外的收获）重点来了，虽然cookie和session均可以保存状态，还有keep-alive持久链接，可是，可是，可是它们并无改变HTTP自己无状态这一点，由于这些办法只是在帮助客户端和服务端创建一套更好的协做通讯关系，以提升通讯和开发效率。安全

HTTP主要经过URI来传输数据和创建来创建链接，这里的URI（Uniform Resource Identifier）指的是统一资源标识符，不一样于URL（Uniform Resource Locator），其指的是统一资源定位符，二者的关系能够理解为URL是一个特殊类型且具体的URI，一个URL里包含了用于查找某个资源的足够信息。就随便拿一个地址举例子来讲：服务器

http://www.google.com:7001/signContract?apptoken=jksldjflkdjslkfjds&contractId=110&orderId=911#usercookie

从这个URL咱们能够看出里边的参数包含一下几项：网络

协议部分：‘http：’这表明网页使用的是http协议，在‘http’后面的‘//’为分割符，此外还有HTTPS、FTP协议，BTW，一个域名下不建议同时掺杂http和https的连接，这样会致使出现混合内容，对网站安全形成威胁，例如以前神策埋点的连接就形成相似问题。具体关于混合内容涉及到we端安全方面的知识，感兴趣的同窗能够去了解下，我也是无心中一个朋友问到这个问题才去了解的，多了解下有害无益嘛。
域名部分：该地址的域名为“www.google.com”，一个URL中也可使用IP地址做为域名使用，好比使用这个IP也能够打开百度首页（渣渣）: 202.108.22.5，至于为何，感兴趣的同窗能够去了解下DNS（Domain Name System）。
端口：“7001”域名后面冒号（：）紧跟着的是端口，能够省略，若是省略的话会采用浏览器的默认端口即80。
目录路径：从端口号开始的第一个“/”开始到最后一个“/”，这之间是目录部分，例如“signContract”。
参数部分：从“？”开始到“#”为止之间的部分是参数，多个参数用“&”链接，此例中的参数是
“apptoken=jksldjflkdjslkfjds&contractId=110&orderId=911”
锚：从“#”开始到最后是锚部分，小融租项目里没有使用到锚点部分，这里示例只作讲解。参数可省略。session

至于http状态码、请求及响应相关的东西就不作详解了，这里我的以为有必要再梳理一下http的工做原理。首先客户端向服务器发送一个请求报文，请求报文中包含请求的方法、url、协议版本、请求头部、请求数据，服务器以一个状态行做为响应，响应的内容包括协议的版本、成功或者错误代码、服务器信息、响应头部和响应数据。如下是http请求响应的步骤：app

客户端链接到web服务器：一般是从浏览器地址栏进入，创建一个TCP套接字链接，例如：“https://www.google.com/”
发送HTTP请求：经过TCP套接字，客户端向web服务器发送一个文本的请求报文，一个请求报文由请求行、请求头部、空行和请求数据4部分组成。
服务器接受请求并返回http响应：web服务器解析请求，定位请求资源。返回给客户端读取。
释放链接：若connection为close，则服务器主动关闭TCP链接，客户端被动关闭链接，释放TCP链接；若connection为keep－alive，则该链接会保持一段时间。
客户端浏览器解析HTML内容：客户端浏览器首先解析状态行，查看代表请求是否成功的状态代码。而后解析响应头，响应头告知一下为若干字节的HTML文档和文档的字符集。客户端浏览器读取响应数据HTML，并在浏览器渲染。性能

以上所述能够理解成一个完整的请求及响应过程，其中还涉及到DNS解析域名、TCP三次握手等细节，由于本篇文章主要介绍HTTP就不作详细讲解（感兴趣的同窗能够去研究下）。关于HTTP相关知识点是我最近接触到的，因此总结一下加深本身的印象，文中如有歧义或是不正确的地方还望不吝指正，不过要想把HTTP整个吃透还相差甚远，毕竟上周在公交车上看到我的拿了一本《图解HTTP》，想一想真的是学海无涯，就如那句hello-world所说，打开了新世界的大门，并且这个新world还有不少东西须要探索，这时就要告诉本身：Keep going and never stop ！

在这里很是感谢维基百科以及如下连接做者的解惑，向大佬看齐【敬礼！】

http://www.jianshu.com/p/80e2...

http://www.cnblogs.com/bellko...