从开发&运维角度方面来看,整体来讲分为如下几个过程:css
URL(Uniform Resource Locator),统一资源定位符,用于定位互联网上资源,俗称网址。html
scheme: // host.domain:port / path / filename ? abc = 123 # 456789
node
scheme - 定义因特网服务的类型。常见的协议有 http、https、ftp、file,
其中最多见的类型是 http,而 https 则是进行加密的网络传输。
host - 定义域主机(http 的默认主机是 www)
domain - 定义因特网域名,好比 baidu.com
port - 定义主机上的端口号(http 的默认端口号是 80)
path - 定义服务器上的路径(若是省略,则文档必须位于网站的根目录中)。
filename - 定义文档/资源的名称
query - 即查询参数
fragment - 即 # 后的hash值,通常用来定位到某个位置
复制代码
在浏览器输入网址后,首先要通过域名解析,由于浏览器并不能直接经过域名找到对应的服务器,而是要经过 IP 地址。nginx
IP 地址是指互联网协议地址,是 IP Address 的缩写。IP 地址是 IP 协议提供的一种统一的地址格式,
它为互联网上的每个网络和每一台主机分配一个逻辑地址,以此来屏蔽物理地址的差别。
复制代码
DNS 协议提供经过域名查找 IP 地址,或逆向从 IP 地址反查域名的服务。
DNS 是一个网络服务器,咱们的域名解析简单来讲就是在 DNS 上记录一条信息记录。
复制代码
DNS域名解析分为递归查询和迭代查询两种方式,现通常为迭代查询。
复制代码
DNS缓存 DNS存在着多级缓存,从离浏览器的距离排序的话,有如下几种: 浏览器缓存,系统缓存,路由器缓存,IPS服务器缓存,根域名服务器缓存,顶级域名服务器缓存,主域名服务器缓存。
web
DNS负载均衡(DNS重定向) DNS负载均衡技术的实现原理是在DNS服务器中为同一个主机名配置多个IP地址,在应答DNS查询时, DNS服务器对每一个查询将以DNS文件中主机记录的IP地址按顺序返回不一样的解析结果,将客户端的访问 引导到不一样的机器上去,使得不一样的客户端访问不一样的服务器,从而达到负载均衡的目的。
apache
DNS Prefetch 是一种 DNS 预解析技术。当你浏览网页时,浏览器会在加载网页时对网页中的域名进行解析缓存,这样在你单击当前网页中的链接时就无需进行 DNS 的解析,减小用户等待时间,提升用户体验。
客户端发送一个带 SYN=1,Seq=X 的数据包到服务器端口(第一次握手,由浏览器发起,告诉服务器我要发送请求了)
后端
服务器发回一个带 SYN=1, ACK=X+1, Seq=Y 的响应包以示传达确认信息(第二次握手,由服务器发起,告诉浏览器我准备接受了,你赶忙发送吧)
浏览器
客户端再回传一个带 ACK=Y+1, Seq=Z 的数据包,表明“握手结束”(第三次握手,由浏览器发送,告诉服务器,我立刻就发了,准备接受吧)
缓存
TCP 三次握手结束后,开始发送 HTTP 请求报文。bash
为避免篇幅过长,http协议、缓存等相关内容请参阅:
从HTTP到WEB缓存
每台服务器上都会安装处理请求的应用——Web server。常见的web server产品有apache、nginx、IIS、Lighttpd等。
伪装我是一个传统的MVC模型,RD同窗请无视
用户界面 (User Interface) - 包括地址栏、后退/前进按钮、书签目录等,也就是你所看到的除了用来显示你所请求页面的主窗口以外的其余部分
浏览器引擎 (Browser Engine) - 用来查询及操做渲染引擎的接口
渲染引擎 (Rendering Engine) - 用来显示请求的内容,例如,若是请求内容为html,它负责解析html及css,并将解析后的结果显示出来
网络 (Networking) - 用来完成网络调用,例如http请求,它具备平台无关的接口,能够在不一样平台上工做
JS解释器 (JS Interpreter) - 用来解释执行JS代码
UI后端 (UI Backend) - 用来绘制相似组合选择框及对话框等基本组件,具备不特定于某个平台的通用接口,底层使用操做系统的用户接口
数据存储 (DB Persistence) - 属于持久层,浏览器须要在硬盘中保存相似cookie的各类数据,HTML5定义了web database技术,这是一种轻量级完整的客户端存储技术
复制代码
浏览器是多进程的,有一个主控进程,以及每个tab页面都会新开一个进程(某些状况下多个tab会合并进程)
进程可能包括主控进程,插件进程,GPU,tab页(浏览器内核)等等
每个tab页面能够看做是浏览器内核进程,而后这个进程是多线程的,它有几大类子线程:
1. 解析HTML,构建DOM树
2. 解析CSS,生成CSS规则树
3. 合并DOM树和CSS规则,生成render树
4. 布局render树(Layout/reflow),负责各元素尺寸、位置的计算
5. 绘制render树(paint),绘制页面像素信息
复制代码
以webkit内核为例
简单的理解,这一步的流程是这样的:浏览器解析HTML,构建DOM树。 解析HTML到构建出DOM固然过程能够简述以下:
Bytes → characters → tokens → nodes → DOM
复制代码
其中比较关键的几个步骤
1. Conversion转换:浏览器将得到的HTML内容(Bytes)基于他的编码转换为单个字符
2. Tokenizing分词:浏览器按照HTML规范标准将这些字符转换为不一样的标记token。每一个token都有本身独特的含义以及规则集
3. Lexing词法分析:分词的结果是获得一堆的token,此时把他们转换为对象,这些对象分别定义他们的属性和规则
4. DOM构建:由于HTML标记定义的就是不一样标签之间的关系,这个关系就像是一个树形结构同样
例如:body对象的父节点就是HTML对象,而后段略p对象的父节点就是body对象
复制代码
同理,CSS规则树的生成也是相似。
Bytes → characters → tokens → nodes → CSSOM
复制代码
当DOM树和CSSOM都有了后,就要开始构建渲染树了
通常来讲,渲染树和DOM树相对应的,但不是严格意义上的一一对应,由于有一些不可见的DOM元素不会插入到渲染树中,如head这种不可见的标签或者display: none等
布局:经过渲染树中渲染对象的信息,计算出每个渲染对象的位置和尺寸。
绘制阶段,系统会遍历呈现树,并调用呈现器的“paint”方法,将呈现器的内容显示在屏幕上。
这张图片中重要的四个步骤
1. 计算CSS样式
2. 构建渲染树
3. 布局,主要定位坐标和大小,是否换行,各类position overflow z-index属性
4. 绘制,将图像绘制出来
复制代码
当数据传送完毕,须要断开 tcp 链接,此时发起 tcp 四次挥手。
(第一次挥手:由浏览器发起的,发送给服务器,我请求报文发送完了,你准备关闭吧)
(第二次挥手:由服务器发起的,告诉浏览器,我请求报文接受完了,我准备关闭了,你也准备吧)
(第三次挥手:由服务器发起,告诉浏览器,我响应报文发送完了,你准备关闭吧)
(第四次挥手:由浏览器发起,告诉服务器,我响应报文接受完了,我准备关闭了,你也准备吧)
参考文章: