推荐阅读《图解HTTP》
从要访问的域名中获取IP地址,DNS查询的步骤以下:html
DNS(Domain Name System,域名系统),因特网上做为域名和IP地址相互映射的一个分布式数据库,可以使用户更方便的访问互联网,而不用去记住可以被机器直接读取的IP数串。经过主机名,最终获得该主机名对应的IP地址的过程叫作域名解析(或主机名解析)。web
当局部DNS服务器本身不能回答客户机的DNS查询时,它就须要向其余DNS服务器进行查询。
此时有两种方式,如图所示的是递归方式。
局部DNS服务器本身负责向其余DNS服务器进行查询,通常是先向该域名的根域服务器查询,再由根域名服务器一级级向下查询。
最后获得的查询结果返回给局部DNS服务器,再由局部DNS服务器返回给客户端。ajax
当局部DNS服务器本身不能回答客户机的DNS查询时,也能够经过迭代查询的方式进行解析,如图所示。
局部DNS服务器不是本身向其余DNS服务器进行查询,而是把能解析该域名的其余DNS服务器的IP地址返回给客户端DNS程序,客户端DNS程序再继续向这些DNS服务器进行查询,直到获得查询结果为止。
也就是说,迭代解析只是帮你找到相关的服务器而已,而不会帮你去查。
好比说:baidu.com的服务器ip地址在192.168.4.5这里,你本身去查吧,本人比较忙,只能帮你到这里了。算法
咱们在前面有说到根DNS服务器,域DNS服务器,这些都是DNS域名称空间的组织方式。
按其功能命名空间中用来描述 DNS 域名称的五个类别的介绍详见下表中,以及与每一个名称类型的示例:数据库
向 http://facebook.com/
发出GET请求浏览器
在请求中,HTTP报文首部由方法、URI、HTTP版本、HTTP首部字段等构成。缓存
《计算机网络》第四版中讲“三次握手”的目的是“为了防止已失效的链接请求报文段忽然又传送到了服务端,于是产生错误”服务器
书中的例子是这样的,“已失效的链接请求报文段”的产生在这样一种状况下:client发出的第一个链接请求报文段并无丢失,而是在某个网络结点长时间的滞留了,以至延误到链接释放之后的某个时间才到达server。
原本这是一个早已失效的报文段。但server收到此失效的链接请求报文段后,就误认为是client再次发出的一个新的链接请求。因而就向client发出确认报文段,赞成创建链接。网络
假设不采用“三次握手”,那么只要server发出确认,新的链接就创建了。因为如今client并无发出创建链接的请求,所以不会理睬server的确认,也不会向server发送数据。但server却觉得新的运输链接已经创建,并一直等待client发来数据。这样,server的不少资源就白白浪费掉了。采用“三次握手”的办法能够防止上述现象发生。
例如刚才那种状况,client不会向server的确认发出确认。server因为收不到确认,就知道client并无要求创建链接。”。主要目的防止server端一直等待,浪费资源。
这是由于服务端在LISTEN状态下,收到创建链接请求的SYN报文后,把ACK和SYN放在一个报文里发送给客户端。
而关闭链接时,当收到对方的FIN报文时,仅仅表示对方再也不发送数据了可是还能接收数据,己方也未必所有数据都发送给对方了,因此己方能够当即close,也能够发送一些数据给对方后,再发送FIN报文给对方来表示赞成如今关闭链接,所以,己方ACK和FIN通常都会分开发送。
客户端原本能够直接经过HTTP协议访问某网站应用服务器,网站管理员能够在中间加上一个Nginx,客户端请求Nginx,Nginx请求应用服务器,而后将结果返回给客户端,此时Nginx就是反向代理服务器。
服务器会发送一个301永久重定向响应来告诉浏览器访问 http://www.facebook.com/
而不是 http://facebook.com/
。
为何服务器坚持重定向而不是直接给予浏览器用户须要的结果,这有不少有意思缘由:
http://www.igoro.com/
和 http://igoro.com/
,搜索引擎会认为这是两个不一样的网站,结果他们两个每一个都有一部分访问量,可是也只能拥有更低的搜索引擎排名。若是使用了301定位,搜索引擎将会识别重定向,进而将同一来源的多个连接算做一个。301和302状态码都表示重定向,就是说浏览器在拿到服务器返回的这个状态码后会自动跳转到一个新的URL地址,这个地址能够从响应的Location首部中获取(用户看到的效果就是他输入的地址A瞬间变成了另外一个地址B)——这是它们的共同点。
他们的不一样在于。301表示旧地址A的资源已经被永久地移除了(这个资源不可访问了),搜索引擎在抓取新内容的同时也将旧的网址换为重定向以后的网址;
302表示旧地址A的资源还在(仍然能够访问),这个重定向只是临时地从旧地址A跳转到地址B,搜索引擎会抓取新的内容而保存旧的网址。 SEO 302好于301
当一个网站或者网页24—48小时内临时移动到一个新的位置,这时候就要进行302跳转,而使用301跳转的场景就是以前的网站由于某种缘由须要移除掉,而后要到新的地址访问,是永久性的。
清晰明确而言:使用301跳转的大概场景以下:
一、 域名到期不想续费(或者发现了更适合网站的域名),想换个域名。
二、 在搜索引擎的搜索结果中出现了不带www的域名,而带www的域名却没有收录,这个时候能够用301重定向来告诉搜索引擎咱们目标的域名是哪个。
三、 空间服务器不稳定,换空间的时候。
浏览器知道了 http://www.facebook.com/
是真正应该访问的URL,因此就发送了另一个GET请求。
服务器会接收这个GET请求,而且返回一个响应结果
小网站会常常有一个SQL数据库来存储他们的数据,可是网站存储数据量过大或者流量过大后就必须将数据库分布在多台机器,解决的方法有不少种
包括sharding(在主键基础上划分表到多个数据库中),复制和使用简化的弱语义一致性数据库
例如,Facebook必须尽快更新新闻供应,但数据支持的“你可能认识的人”功能可能只须要每晚进行更新(做者猜想是这样)。批处理做业的更新致使存在一些旧的相对不重要的数据,可是使数据更新更快更简单。
HTTP/1.1 200 OK Cache-Control: private, no-store, no-cache, must-revalidate, post-check=0, pre-check=0 Expires: Sat, 01 Jan 2000 00:00:00 GMT P3P: CP="DSP LAW" Pragma: no-cache Content-Encoding: gzip Content-Type: text/html; charset=utf-8 X-Cnection: close Transfer-Encoding: chunked Date: Fri, 12 Feb 2010 09:05:55 GMT ...
整个完整的响应是36KB,其中大部分处理后由blob类型传送
内容编码头部告诉浏览器响应体使用了gzip压缩算法。在解析blob后,你就会看到你指望的HTML了。
在浏览器接收完整HTML文件前,浏览器就开始渲染页面了。
随着浏览器渲染HTML,浏览器会注意到有些标签须要请求其余URLs的资源,浏览器将会发送一个GET请求来从新获取每一个文件 。
在web2.0时代,即便在页面渲染后客户端仍是持续与服务器端通讯。
例如,当你的朋友上线或下线时,Facebook聊天功能将会持续更新你已经登陆的朋友列表。为了更新这个列表,你浏览器上运行的JS将会发送异步请求到服务器,异步请求是发送给特殊URL的GET或POST请求。在Facebook的例子中,客户端会发送一个POST请求到 http://www.facebook.com/ajax/chat/buddy_list.php
,获取你在线的朋友列表
这个模式被称为AJAX,是“Asynchronous JavaScript And XML”,的缩写,虽然不太清楚为何服务器必须将响应格式化为xml。