Apache之HTTP协议

时间 2020-07-23

标签 apache http 协议栏目 Apache 繁體版

原文原文链接

HTTP(Hypertext Transfer Protocol)超文本传输协议。是一种详细规定了客户端浏览器和万维网服务器之间相互通信的规则，经过因特网传送万维网文档的数据传送协议。
html

HTTP的前世此生

超文本传输协议的前身是Xanadu项目，超文本的概念是泰德.纳尔森在1960年提出的。而HTTP在1989年诞生在CERN(欧洲量子物理实验室)。1990年12月，超文本协议在CERN首次上线。1991年夏天，继Telnet等协议以后，超文本传输协议正式成为互联网诸多协议的一份子。nginx

HTTP诞生的缘由：为了实现从一台计算机上获取并显示存放在多台计算机里的文件、数据、图片和其余类型的文件而诞生HTTP协议。由于在当时其余诸多已经诞生的协议解决不了这个问题。例如：Telnet、SMTP、POP三、IAMP四、FTP等。因此HTTP协议应运而生。web

HTTP协议的版本

HTTP 0.9chrome

HTTP 0.9做为HTTP协议的第一个成熟版本。此版本功能很是薄弱。浏览器

1）请求只有一行缓存

2）没有HTTP头部信息和错误代码信息安全

3）只能接收一种类型的数据：纯文本服务器

4）只有一种方法：GETcookie

HTTP 1.0
网络

随着互联网的发展，HTTP 0.9已经不能知足互联网发展的需求。所以HTTP 1.0就这样诞生了。HTTP 1.0的最大改变是引入了POST方法，使得客户端经过HTML表单向服务器发送数据成为可能。从而实现了客户端和服务器端的数据交互。这是WEB应用程序的一个基础。另外一个巨大的改变是引入了HTTP头，使得HTTP协议不只能返回错误代码，而且借助于MIME技术可以传输更为丰富的文件类型，再也不局限于纯文本。还能够是图片、动画等其余文件格式。

除此以外，还容许保持链接，即一次TCP链接，能够实现屡次通信。HTTP 1.0默认是传输一次数据后就关闭链接。

HTTP 1.1

2000年5月，HTTP 1.1诞生。HTTP 1.1并不像HTTP 1.0对HTTP 0.9那样的革命性。可是对HTTP 1.0作了不少功能性的加强。

1）增长了Host头。

使得GET后面只需使用相对路径

使得一台主机可使用多个域名

2）引入了Range头

使得客户端经过HTTP下载时只下载内容的一部分，使得多线程下载成为可能

HTTP协议的特色

1）支持C/S模式。支持基本认证和安全认证

2）简单快速。

客户端向服务器请求服务时，只需传送请求方法和路径。请求方法经常使用的有GET、HEAD、POST。每种方法规定了客户端与服务器端联系的不一样类型。因为HTTP协议简单，使得HTTP服务器的程序规模小，于是通信速度快。

3）灵活。

HTTP协议容许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。

4）HTTP 0.9和HTTP 1.0使用非持续链接：限制每次链接只处理一个请求，服务器处理完客户端的请求，并收到客户端的应答后，即断开链接。采用这种方式能够节省传输时间。

HTTP 1.1使用持续链接：没必要为每一个Web对象建立一个新的链接，一个链接能够传送多个对象。

5）无状态：HTTP协议是无状态协议。无状态是指协议对于事物处理没有记忆能力。缺乏状态意味着若是后续处理须要前面的信息，则它必须重传，这样可能致使每次链接传送的数据量增大。

HTTP实现原理

在TCP/IP协议栈中的位置：

HTTP协议一般承载于TCP协议之上，有时也承载于TLS或SSL协议层之上，这个时候，就成了咱们常说的HTTPS。以下图所示：

默认HTTP的端口号为80，HTTPS的端口号为443。

HTTP的请求响应模型：

HTTP协议永远都是客户端发起请求，服务器回送响应。以下图所示：

这样就限制了使用HTTP协议，没法实如今客户端没有发起请求的时候，服务器将消息推送给客户端。

HTTP协议是一个无状态的协议，同一个客户端的此次请求和上次请求是没有对应关系。

工做流程：

一次HTTP操做称为一个事务，其工做过程可分为四步：

1）首先客户机与服务器须要创建链接。只要单击某个超级连接，HTTP的工做开始。

2）创建链接后，客户机发送一个请求给服务器，请求方式的格式为：统一资源标识符（URL）、协议版本号，后边是MIME信息包括请求修饰符、客户机信息和可能的内容。

3）服务器接到请求后，给予相应的响应信息，其格式为一个状态行，包括信息的协议版本号、一个成功或错误的代码，后边是MIME信息包括服务器信息、实体信息和可能的内容。

4）客户端接收服务器所返回的信息经过浏览器显示在用户的显示屏上，而后客户机与服务器断开链接。

若是在以上过程当中的某一步出现错误，那么产生错误的信息将返回到客户端，有显示屏输出。对于用户来讲，这些过程是由HTTP本身完成的，用户只要用鼠标点击，等待信息显示就能够了。

简化版：

1，创建链接

2，接收请求

3，处理请求

4，获取资源

5，构建响应

6，回送响应

7，记录日志

HTTP的几个重要概念

URI、URL、URN：

URI：Uniform Resource Identifier，统一资源标识符；

URL：Uniform Resource Locator，统一资源定位符；

URN：Uniform Resource Name，统一资源命名符

其中，URL,URN是URI的子集。

Web上地址的基本形式是URI,它表明通用资源标识符。有两种形式：

URL：目前URI的最广泛形式就是无处不在的URL或统一资源定位器。

URN：URL的一种更新形式，统一资源名称(URN, Uniform Resource Name)不依赖于位置，而且有可能减小失效链接的个数。可是其流行还需假以时日，由于它须要更精密软件的支持。

URI格式：

scheme://[username:password@]HOST:port/path/to/source

链接(Connection)：

一个传输层的实际环流，它是创建在两个相互通信的应用程序之间。

在http1.1，request和reponse头中都有可能出现一个connection的头，此header的含义是当client和server通讯时对于长连接如何进行处理。

在http1.1中，client和server都是默认对方支持长连接的，若是client使用http1.1协议，但又不但愿使用长连接，则须要在header中指明connection的值为close；若是server方也不想支持长连接，则在response中也须要明确说明connection的值为close。不论request仍是response的header中包含了值为close的connection，都代表当前正在使用的tcp连接在当天请求处理完毕后会被断掉。之后client再进行新的请求时就必须建立新的tcp连接了.

消息(Message):

HTTP通信的基本单位，包括一个结构化的八元组序列并经过链接传输。

请求(Request):

一个从客户端到服务器的请求信息包括应用于资源的方法、资源的标识符和协议的版本号。

响应(Response):

一个从服务器返回的信息包括HTTP协议的版本号、请求的状态(例如“成功”或“没找到”)和文档的MIME类型。

资源(Resource):

由URI标识的网络数据对象或服务。

实体(Entity):

数据资源或来自服务资源的回映的一种特殊表示方法，它可能被包围在一个请求或响应信息中。一个实体包括实体头信息和实体的自己内容。

客户机(Client):

一个为发送请求目的而创建链接的应用程序。

用户代理(UserAgent):

初始化一个请求的客户机。它们是浏览器、编辑器或其它用户工具。

服务器(Server):

一个接受链接并对请求返回信息的应用程序。

源服务器(OriginServer):

是一个给定资源能够在其上驻留或被建立的服务器。

代理(Proxy):

一个中间程序，它能够充当一个服务器，也能够充当一个客户机，为其它客户机创建请求。请求是经过可能的翻译在内部或通过传递到其它的服务器中。一个代理在发送请求信息以前，必须解释而且若是可能重写它。

代理常常做为经过防火墙的客户机端的门户，代理还能够做为一个帮助应用来经过协议处理没有被用户代理完成的请求。

网关(Gateway):

一个做为其它服务器中间媒介的服务器。与代理不一样的是，网关接受请求就好象对被请求的资源来讲它就是源服务器；发出请求的客户机并无意识到它在同网关打交道。

网关常常做为经过防火墙的服务器端的门户，网关还能够做为一个协议翻译器以便存取那些存储在非HTTP系统中的资源。

通道(Tunnel):

是做为两个链接中继的中介程序。一旦激活，通道便被认为不属于HTTP通信，尽管通道多是被一个HTTP请求初始化的。当被中继的链接两端关闭时，通道便消失。当一个门户(Portal)必须存在或中介(Intermediary)不能解释中继的通信时通道被常用。

缓存(Cache):

反应信息的局域存储。

HTTP协议头

HTTP头按照其不一样的做用，分为四类：

1）通用头(General Header)

通用头便可以包含在HTTP请求中，也能够包含在HTTP响应中。通用头的做用是描叙HTTP协议自己。好比描叙HTTP是否持续链接的Connection头，HTTP发送日期的Date头，描述HTTP所在的TCP链接时间的Keep-Alive头，用于缓存控制的Cache-Control头等。

2）实体头(Entity Header)

实体头是那些描叙HTTP信息的头。便可出如今HTTP POST方法的请求中，也能够出如今HTTP响应中。例如Content-Type和Content-length都是描述实体的类型和大小的头都属于实体头。其它还有用于描述实体的Content-Language,Content-MD5,Content-Encoding以及控制实体缓存的Expires和Last-Modifies头等。

常见的实体头以下：

l Allow：服务器支持哪些请求方法（如GET、POST等）；

l Content-Encoding：文档的编码（Encode）方法，例如：gzip，见“2.5 响应头”；

l Content-Language：内容的语言类型，例如：zh-cn；

l Content-Length：表示内容长度，eg：80，可参考“2.5响应头”；

l Content-Location：表示客户应当到哪里去提取文档

l Content-MD5：MD5 实体的一种MD5摘要，用做校验和。发送方和接受方都计算MD5摘要，接受方将其计算的值与此头标中传递的值进行比较。Eg1：Content-MD5: <base64 of 128 MD5 digest>。Eg2：dfdfdfdfdfdfdff==；

l Content-Range：随部分实体一同发送；标明被插入字节的低位与高位字节偏移，也标明此实体的总长度。Eg1：Content-Range: 1001-2000/5000，eg2：bytes 2543-4532/7898

l Content-Type：标明发送或者接收的实体的MIME类型。Eg：text/html; charset=GB2312 主类型/子类型；

l Expires：为0证实不缓存；

l Last-Modified：WEB 服务器认为对象的最后修改时间，好比文件的最后修改时间，动态页面的最后产生时间等等。例如：Last-Modified：Tue, 06 May 2008 02:42:43 GMT.

3）请求头(HTTP Request Header)

请求头是那些由客户端发往服务器端以便帮助服务器端更好的知足客户端请求的头。请求头只能出如今HTTP请求中。好比告诉服务器只接收某种响应内容的Accept头，发送Cookies的Cookie头，显示请求主机域的HOST头，用于缓存的If-Match,If-Match-Since,If-None-Match头，用于只取HTTP响应信息中部分信息的Range头，用于附属HTML相关请求引用的Referee头等。

常见请求头以下：

l Accept：浏览器可接受的MIME类型；

l Accept-Charset：浏览器可接受的字符集；

l Accept-Encoding：浏览器可以进行解码的数据编码方式，好比gzip。Servlet可以向支持gzip的浏览器返回经gzip编码的HTML页面。许多情形下这能够减小5到10倍的下载时间；

l Accept-Language：浏览器所但愿的语言种类，当服务器可以提供一种以上的语言版本时要用到；

l Authorization：受权信息，一般出如今对服务器发送的WWW-Authenticate头的应答中；

l Connection：表示是否须要持久链接。若是Servlet看到这里的值为“Keep-Alive”，或者看到请求使用的是HTTP 1.1（HTTP 1.1默认进行持久链接），它就能够利用持久链接的优势，当页面包含多个元素时（例如Applet，图片），显著地减小下载所须要的时间。要实现这一点，Servlet须要在应答中发送一个Content-Length头，最简单的实现方法是：先把内容写入ByteArrayOutputStream，而后在正式写出内容以前计算它的大小；

l Content-Length：表示请求消息正文的长度；

l Cookie：这是最重要的请求头信息之一；

l From：请求发送者的email地址，由一些特殊的Web客户程序使用，浏览器不会用到它；

l Host：初始URL中的主机和端口；

l If-Modified-Since：只有当所请求的内容在指定的日期以后又通过修改才返回它，不然返回304“Not Modified”应答；

l Pragma：指定“no-cache”值表示服务器必须返回一个刷新后的文档，即便它是代理服务器并且已经有了页面的本地拷贝；

l Referer：包含一个URL，用户从该URL表明的页面出发访问当前请求的页面。

l User-Agent：浏览器类型，若是Servlet返回的内容与浏览器类型有关则该值很是有用；

l UA-Pixels，UA-Color，UA-OS，UA-CPU：由某些版本的IE浏览器所发送的非标准的请求头，表示屏幕大小、颜色深度、操做系统和CPU类型。

4）响应头(HTTP Response Header)

HTTP响应头是那些描述HTTP响应自己的头，这里并不包含描述HTTP响应中第三部分也就是HTTP信息的头（这部分由实体头负责）。好比说定时刷新的Refresh头，当遇到503错误时自动重试的Retry-After头，显示服务器信息的Server头，设置COOKIE的Set-Cookie头，告诉客户端能够部分请求的Accept-Ranges头等。

常见响应头以下：

l Allow：服务器支持哪些请求方法（如GET、POST等）；

l Content-Encoding：文档的编码（Encode）方法。只有在解码以后才能够获得Content-Type头指定的内容类型。利用gzip压缩文档可以显著地减小HTML文档的下载时间。Java的GZIPOutputStream能够很方便地进行gzip压缩，但只有Unix上的Netscape和Windows上的IE 4、IE 5才支持它。所以，Servlet应该经过查看Accept-Encoding头（即request.getHeader("Accept-Encoding")）检查浏览器是否支持gzip，为支持gzip的浏览器返回经gzip压缩的HTML页面，为其余浏览器返回普通页面；

l Content-Length：表示内容长度。只有当浏览器使用持久HTTP链接时才须要这个数据。若是你想要利用持久链接的优点，能够把输出文档写入ByteArrayOutputStram，完成后查看其大小，而后把该值放入Content-Length头，最后经过byteArrayStream.writeTo(response.getOutputStream()发送内容；

l Content-Type：表示后面的文档属于什么MIME类型。Servlet默认为text/plain，但一般须要显式地指定为text/html。因为常常要设置Content-Type，所以HttpServletResponse提供了一个专用的方法setContentTyep。可在web.xml文件中配置扩展名和MIME类型的对应关系；

l Date：当前的GMT时间。你能够用setDateHeader来设置这个头以免转换时间格式的麻烦；

l Server：服务器软件名称及版本。

l Age：响应给客户端的文档能够缓存多长时间

l Public：

l Vary：

l Set-Cookie：

l Set-Cookie2：

l Expires：指明应该在何时认为文档已通过期，从而再也不缓存它。

l Last-Modified：文档的最后改动时间。客户能够经过If-Modified-Since请求头提供一个日期，该请求将被视为一个条件GET，只有改动时间迟于指定时间的文档才会返回，不然返回一个304（Not Modified）状态。Last-Modified也可用setDateHeader方法来设置；

l Location：表示客户应当到哪里去提取文档。Location一般不是直接设置的，而是经过HttpServletResponse的sendRedirect方法，该方法同时设置状态代码为302；

l Refresh：表示浏览器应该在多少时间以后刷新文档，以秒计。除了刷新当前文档以外，你还能够经过setHeader("Refresh", "5; URL=http://host/path")让浏览器读取指定的页面。注意这种功能一般是经过设置HTML页面HEAD区的<META HTTP-EQUIV="Refresh" CONTENT="5;URL=http://host/path">实现，这是由于，自动刷新或重定向对于那些不能使用CGI或Servlet的HTML编写者十分重要。可是，对于Servlet来讲，直接设置Refresh头更加方便。注意Refresh的意义是“N秒以后刷新本页面或访问指定页面”，而不是“每隔N秒刷新本页面或访问指定页面”。所以，连续刷新要求每次都发送一个Refresh头，而发送204状态代码则能够阻止浏览器继续刷新，无论是使用Refresh头仍是<META HTTP-EQUIV="Refresh" ...>。注意Refresh头不属于HTTP 1.1正式规范的一部分，而是一个扩展，但Netscape和IE都支持它。

HTTP请求

HTTP请求由三部分组成，分别是：请求行、消息报头、请求正文

请求行以一个方法符开头，以空格分开，后面跟着请求的URI和协议的版本，格式以下：

Method Request-URI HTTP-Version CRLF

Method表示请求方法；

Request-URI是一个统一资源标识符，也就是资源路径；

HTTP-Version表示HTTP协议版本；

CRLF表示回车和换行。

请求方法：

GET 请求获取Request-URI所标识的资源

POST 在Request-URI所标识的资源后附加新的数据,经常使用于提交表单

HEAD 请求获取由Request-URI所标识的资源的响应消息报头

PUT 请求服务器存储一个资源，并用Request-URI做为其标识

DELETE 请求服务器删除Request-URI所标识的资源

TRACE 请求服务器回送收到的请求信息，主要用于测试或诊断

能够追踪一次请求中间所通过的代理服务器有哪些

CONNECT 保留未来使用

OPTIONS 请求查询服务器的性能，或者查询与资源相关的选项和需求

能够用来获取服务器端资源支持的方法

HTTP响应

在接收和解释请求消息后，服务器返回一个HTTP响应消息。

HTTP响应也是由三个部分组成，分别是：状态行、消息报头、响应正文

状态行格式以下：

HTTP-Version Status-Code Reason-Phrase CRLF

HTTP-Version表示服务器HTTP协议的版本；

Status-Code表示服务器发回的响应状态代码；

Reason-Phrase表示状态代码的文本描述。

状态代码有三位数字组成，第一个数字定义了响应的类别，且有五种可能取值：

1xx：指示信息--表示请求已接收，继续处理
2xx：成功--表示请求已被成功接收、理解、接受
3xx：重定向--信息不完整须要进一步补充
4xx：客户端错误--请求有语法错误或请求没法实现
5xx：服务器端错误--服务器未能实现合法的请求

常见http响应状态码：

请求收到，继续处理：

100 客户端必须继续发出请求

101 客户端要求服务器根据请求转换HTTP协议版本

操做成功收到，分析，接受：

200 交易成功

201 提示知道新文件的URL

202 接受和处理、但处理未完成

203 返回信息不肯定或不完整

204 请求收到，但返回信息为空

205 服务器完成了请求，用户代理必须复位当前已经浏览过的文件

206 服务器已经完成了部分用户的GET请求

重定向：

300 请求的资源可在多处获得

301 永久重定向，在Location响应首部的值仍为当前URL(隐式重定向)

302 临时重定向，在Location响应首部的值仍为新的URL(显示重定向)

303 建议客户端访问其余URL或访问方式

304 Not Modified 请求的资源没有改变能够继续使用缓存

305 请求的资源必须从服务器指定的地址获得

306 前一版本HTTP中使用的代码，现行版本中再也不使用

307 声明请求的资源临时性删除

客户端错误：

400 错误请求，如语法错误

401 未受权

HTTP 401.1 未受权，登陆失败

HTTP 401.2 未受权，服务器配置问题致使登陆失败

HTTP 401.3 ACL 禁止访问资源

HTTP 401.4 未受权受权被筛选器拒绝

HTTP 401.5 未受权 ISAPI或CGI受权失败

402 保留有效ChargeTo头响应

403 禁止访问

HTTP 403.1 禁止访问禁止可执行访问

HTTP 403.2 禁止访问禁止读访问

HTTP 403.3 禁止访问禁止写访问

HTTP 403.4 禁止访问要求SSL

HTTP 403.5 禁止访问要求SSL 128

HTTP 403.6 禁止访问 IP地址被拒绝

HTTP 403.7 禁止访问要求客户端证书

HTTP 403.8 禁止访问禁止站点访问

HTTP 403.9 禁止访问链接的用户过多

HTTP 403.10 禁止访问配置无效

HTTP 403.11 禁止访问密码更改

HTTP 403.12 禁止访问映射器拒绝访问

HTTP 403.13 禁止访问客户端证书已被吊销

HTTP 403.15 禁止访问客户端访问许可过多

HTTP 403.16 禁止访问客户端证书不可信或者无效

HTTP 403.17 禁止访问客户端证书已经到期或者还没有生效

404 没有发现文件、查询或URL

405 用户在Request-Line字段定义的方法不容许

406 根据用户发送的Accept拖，请求资源不可访问

407 相似401，用户必须首先在代理服务器上获得受权

408 客户端没有在用户指定的饿时间内完成请求

409 对当前资源状态，请求不能完成

410 服务器上再也不有此资源且无进一步的参考地址

411 服务器拒绝用户定义的Content-Length属性请求

412 一个或多个请求头字段在当前请求中错误

413 请求的资源大于服务器容许的大小

414 请求的资源URL长于服务器容许的长度

415 请求资源不支持请求项目格式

416 请求中包含Range请求头字段，在当前请求资源范围内没有range指示值，请求也不包含If-Range请求头字段

417 服务器不知足请求Expect头字段指定的指望值，若是是代理服务器，多是下一级服务器不能知足请求长

服务器端错误:

500 - 内部服务器错误

　　 HTTP 500.100 - 内部服务器错误

　　 HTTP 500-11 服务器关闭

　　 HTTP 500-12 应用程序从新启动

　　 HTTP 500-13 - 服务器太忙

　　 HTTP 500-14 - 应用程序无效

　　 HTTP 500-15 - 不容许请求

501 - 未实现

502 - 网关错误

503 - 服务不可用

504 - 网关超时

使用Telnet手工获取HTTP Server资源

1，发起链接请求：

2，请求并获取HTTP资源:

HTTP状态保持

HTTP 协议自己是无状态的，这与HTTP协议原本的目的是相符的，客户端只须要简单的向服务器请求下载某些文件，不管是客户端仍是服务器都没有必要纪录彼此过去的行为，每一次请求之间都是独立的，比如一个顾客和一个自动售货机或者一个普通的（非会员制）大卖场之间的关系同样。

然而聪明（或者贪心？）的人们很快发现若是可以提供一些按需生成的动态信息会使web变得更加有用，就像给有线电视加上点播功能同样。这种需求一方面迫使HTML逐步添加了表单、脚本、DOM等客户端行为，另外一方面在服务器端则出现了CGI规范以响应客户端的动态请求，做为传输载体的HTTP协议也添加了文件上载、 cookie这些特性。其中cookie的做用就是为了解决HTTP协议无状态的缺陷所做出的努力。至于后来出现的session机制则是又一种在客户端与服务器之间保持状态的解决方案。

Cookie和Session都为了用来保存状态信息，都是保存客户端状态的机制，它们都是为了解决HTTP无状态的问题而所作的努力。

Session能够用Cookie来实现，也能够用URL回写的机制来实现。用Cookie来实现的Session能够认为是对Cookie更高级的应用。

Cookie和Session有如下明显的不一样点：

1）Cookie将状态保存在客户端，Session将状态保存在服务器端；

2）Cookies是服务器在本地机器上存储的小段文本并随每个请求发送至同一个服务器。Cookie最先在RFC2109中实现，后续RFC2965作了加强。网络服务器用HTTP头向客户端发送cookies，在客户终端，浏览器解析这些cookies并将它们保存为一个本地文件，它会自动将同一服务器的任何请求缚上这些cookies。Session并无在HTTP的协议中定义；

3）Session是针对每个用户的，变量的值保存在服务器上，用一个sessionID来区分是哪一个用户session变量,这个值是经过用户的浏览器在访问的时候返回给服务器，当客户禁用cookie时，这个值也可能设置为由get来返回给服务器；

4）就安全性来讲：当你访问一个使用session 的站点，同时在本身机子上创建一个cookie，建议在服务器端的SESSION机制更安全些.由于它不会任意读取客户存储的信息。

Session机制：

Session机制是一种服务器端的机制，服务器使用一种相似于散列表的结构（也可能就是使用散列表）来保存信息。

当程序须要为某个客户端的请求建立一个session的时候，服务器首先检查这个客户端的请求里是否已包含了一个session标识 - 称为 session id，若是已包含一个session id则说明之前已经为此客户端建立过session，服务器就按照session id把这个 session检索出来使用（若是检索不到，可能会新建一个），若是客户端请求不包含session id，则为此客户端建立一个session而且生成一个与此session相关联的session id，session id的值应该是一个既不会重复，又不容易被找到规律以仿造的字符串，这个 session id将被在本次响应中返回给客户端保存。

Session的实现方式：

使用Cookie来实现：

服务器给每一个Session分配一个惟一的JSESSIONID，并经过Cookie发送给客户端。

当客户端发起新的请求的时候，将在Cookie头中携带这个JSESSIONID。这样服务器可以找到这个客户端对应的Session。

流程以下图所示：

使用URL回显来实现

URL回写是指服务器在发送给浏览器页面的全部连接中都携带JSESSIONID的参数，这样客户端点击任何一个连接都会把JSESSIONID带会服务器。

若是直接在浏览器输入服务端资源的url来请求该资源，那么Session是匹配不到的。

Tomcat对Session的实现，是一开始同时使用Cookie和URL回写机制，若是发现客户端支持Cookie，就继续使用Cookie，中止使用URL回写。若是发现Cookie被禁用，就一直使用URL回写。jsp开发处理到Session的时候，对页面中的连接记得使用response.encodeURL()。

与Cookie相关的HTTP扩展头：

1）Cookie：客户端将服务器设置的Cookie返回到服务器；

2）Set-Cookie：服务器向客户端设置Cookie；

3）Cookie2 (RFC2965)）：客户端指示服务器支持Cookie的版本；

4）Set-Cookie2 (RFC2965)：服务器向客户端设置Cookie。

Cookie的流程：

服务器在响应消息中用Set-Cookie头将Cookie的内容回送给客户端，客户端在新的请求中将相同的内容携带在Cookie头中发送给服务器。从而实现会话的保持。

流程以下图所示：

Web缓存

什么是Web缓存：

WEB缓存(cache)位于Web服务器和客户端之间。

缓存会根据请求保存输出内容的副本，例如html页面，图片，文件，当下一个请求来到的时候：若是是相同的URL，缓存直接使用副本响应访问请求，而不是向源服务器再次发送请求。

HTTP协议定义了相关的消息头来使WEB缓存尽量好的工做。

Web缓存的优势：

1）减小相应延迟：由于请求从缓存服务器（离客户端更近）而不是源服务器被相应，这个过程耗时更少，让web服务器看上去相应更快。

2）减小网络带宽消耗：当副本被重用时会减低客户端的带宽消耗；客户能够节省带宽费用，控制带宽的需求的增加并更易于管理。

与缓存相关的HTTP消息头：

Expires：指示响应内容过时的时间，格林威治时间GMT

Cache-Control：更细致的控制缓存的内容

Last-Modified：响应中资源最后一次修改的时间

ETag：响应中资源的校验值，在服务器上某个时段是惟一标识的。

Date：服务器的时间

If-Modified-Since：客户端存取的该资源最后一次修改的时间，同Last-Modified。

If-None-Match：客户端存取的该资源的检验值，同ETag。

客户端缓存生效的常见流程：

服务器收到请求时，会在200 OK中回送该资源的Last-Modified和ETag头，客户端将该资源保存在cache中，并记录这两个属性。当客户端须要发送相同的请求时，会在请求中携带If-Modified-Since和If-None-Match两个头。两个头的值分别是响应中Last-Modified和ETag头的值。服务器经过这两个头判断本地资源未发生变化，客户端不须要从新下载，返回304响应。

常见流程以下图所示：

Web缓存机制：

HTTP/1.1中缓存的目的是为了在不少状况下减小发送请求，同时在许多状况下能够不须要发送完整响应。前者减小了网络回路的数量；HTTP利用一个“过时（expiration）”机制来为此目的。后者减小了网络应用的带宽；HTTP用“验证（validation）”机制来为此目的。

HTTP定义了3种缓存机制：

1）Freshness：容许一个回应消息能够在源服务器不被从新检查，而且能够由服务器和客户端来控制。例如，Expires回应头给了一个文档不可用的时间。Cache-Control中的max-age标识指明了缓存的最长时间；

2）Validation：用来检查以一个缓存的回应是否仍然可用。例如，若是一个回应有一个Last-Modified回应头，缓存可以使用If-Modified-Since来判断是否已改变，以便判断根据状况发送请求；

3）Invalidation：在另外一个请求经过缓存的时候，经常有一个反作用。例如，若是一个URL关联到一个缓存回应，可是其后跟着POST、PUT和DELETE的请求的话，缓存就会过时。

断点续传和多线程下载的实现原理

q HTTP协议的GET方法，支持只请求某个资源的某一部分；

q 206 Partial Content 部份内容响应；

q Range 请求的资源范围；

q Content-Range 响应的资源范围；

q 在链接断开重连时，客户端只请求该资源未下载的部分，而不是从新请求整个资源，来实现断点续传。

分块请求资源实例：

Eg1：Range: bytes=306302- ：请求这个资源从306302个字节到末尾的部分；

Eg2：Content-Range: bytes 306302-604047/604048：响应中指示携带的是该资源的第306302-604047的字节，该资源共604048个字节；

客户端经过并发的请求相同资源的不一样片断，来实现对某个资源的并发分块下载。从而达到快速下载的目的。目前流行的FlashGet和迅雷基本都是这个原理。

多线程下载的原理：

q 下载工具开启多个发出HTTP请求的线程；

q 每一个http请求只请求资源文件的一部分：Content-Range: bytes 20000-40000/47000；

q 合并每一个线程下载的文件。

HTTP代理服务器

代理服务器英文全称是Proxy Server，其功能就是代理网络用户去取得网络信息。形象的说：它是网络信息的中转站。

代理服务器是介于浏览器和Web服务器之间的一台服务器，有了它以后，浏览器不是直接到Web服务器去取回网页而是向代理服务器发出请求，Request信号会先送到代理服务器，由代理服务器来取回浏览器所须要的信息并传送给你的浏览器。

并且，大部分代理服务器都具备缓冲的功能，就好象一个大的Cache，它有很大的存储空间，它不断将新取得数据储存到它本机的存储器上，若是浏览器所请求的数据在它本机的存储器上已经存在并且是最新的，那么它就不从新从Web服务器取数据，而直接将存储器上的数据传送给用户的浏览器，这样就能显著提升浏览速度和效率。

更重要的是：Proxy Server(代理服务器)是Internet链路级网关所提供的一种重要的安全功能，它的工做主要在开放系统互联(OSI)模型的对话层。

HTTP代理服务器的主要功能：

1）突破自身IP访问限制，访问国外站点。如：教育网、169网等网络用户能够经过代理访问国外网站；

2）访问一些单位或团体内部资源，如某大学FTP(前提是该代理地址在该资源的容许访问范围以内)，使用教育网内地址段免费代理服务器，就能够用于对教育网开放的各种FTP下载上传，以及各种资料查询共享等服务；

3）突破中国电信的IP封锁：中国电信用户有不少网站是被限制访问的，这种限制是人为的，不一样Serve对地址的封锁是不一样的。因此不能访问时能够换一个国外的代理服务器试试；

4）提升访问速度：一般代理服务器都设置一个较大的硬盘缓冲区，当有外界的信息经过时，同时也将其保存到缓冲区中，当其余用户再访问相同的信息时，则直接由缓冲区中取出信息，传给用户，以提升访问速度；

5）隐藏真实IP：上网者也能够经过这种方法隐藏本身的IP，免受***。

HTTP代理图示：

对于客户端浏览器而言，http代理服务器至关于服务器。

而对于Web服务器而言，http代理服务器又担当了客户端的角色

虚拟主机的实现

什么是虚拟主机：

虚拟主机：是在网络服务器上划分出必定的磁盘空间供用户放置站点、应用组件等，提供必要的站点功能与数据存放、传输功能。

所谓虚拟主机，也叫“网站空间”就是把一台运行在互联网上的服务器划分红多个“虚拟”的服务器，每个虚拟主机都具备独立的域名和完整的Internet服务器（支持WWW、FTP、E-mail等）功能。一台服务器上的不一样虚拟主机是各自独立的，并由用户自行管理。但一台服务器主机只可以支持必定数量的虚拟主机，当超过这个数量时，用户将会感到性能急剧降低。

虚拟主机的实现原理：

虚拟主机是用同一个WEB服务器，为不一样域名网站提供服务的技术。Apache、Tomcat等都可经过配置实现这个功能。