HTTPS如何确保Web安全

时间 2019-12-09

标签 https 如何确保 web 安全栏目 HTML 繁體版

原文原文链接

前言：全网HTTPS势在必行

HTTPS（全称：HyperText Transfer Protocol over Secure Socket Layer），是为了保证客户端与服务器之间数据传输的安全。近两年，Google、Baidu、Facebook 等这样的互联网巨头，不谋而合地开始大力推行 HTTPS，国内外的大型互联网公司不少也都已经启用了全站 HTTPS，这也是将来互联网发展的趋势，做为前端工程师，了解HTTPS的原理也是必修课之一。
2019年离全网使用HTTPS已经不远了，列举几个各大互联网公司为鼓励使用HTTPS而提出的要求：
1.Google的搜索引擎算法，让采用 HTTPS 的网站在搜索中排名更靠前；
2.苹果要求App Store中的全部应用都必须使用 HTTPS 加密链接；
3.微信小程序也要求必须使用 HTTPS 协议；
4.新一代的 HTTP/2 协议的支持需以 HTTPS 为基础；
5.新版本chrome已将HTTP协议网站标记不安全前端

隐患：为何要给HTTP加S？

HTTP协议从诞生至今已经具备至关优秀和方便的一面，然而HTTP并不是只有好的一面，事物皆具两面性，它的不足之处也是很明显：算法

通讯使用明文传输，内容可能会被窃听
不验证通讯方的身份，所以有可能遭遇假装
没法证实报文的完整性，因此有可能已经遭到篡改

除此以外，HTTP自己还有不少缺点。并且，还有像某些特定的Web服务器和特定的Web浏览器在实际应用中存在的不足（也能够说成是脆弱性或安全漏洞），另外，用Java和PHP等编程语言开发的Web应用也可能存在安全漏洞。chrome

1. 通讯使用明文可能会被窃听

因为HTTP自己不具有加密的功能，因此也没法作到对通讯总体（使用HTTP协议通讯的请求和响应的内容）进行加密。因此，HTTP报文使用明文方式发送。若是要问为何通讯时不加密是一个缺点，这是由于，按TCP/IP协议族的工做机制，通讯内容在全部的通讯线路上都有可能遭到窥视。
所谓互联网，是由能连通到全世界的网络组成，不管世界哪一个角落的服务器在和客户端通讯时，在此通讯线路上的某些网络设备、光缆、计算机等都不多是我的的私有物，因此不排除某个环节中会遭到恶意窥视行为。
即便已通过加密处理的通讯，也会被窥视到通讯内容，这点和未加密的通讯是相同的。只是说若是通讯通过加密，就有可能让人没法破解报文信息的含义，但加密处理后的报文信息自己仍是会被看到。
窃听相同段上的通讯并不是难事。只须要收集在互联网上流动的数据包就行。对于收集来的数据包的解析工做，能够交给那些抓包或嗅探工具。编程

2. 不验证通讯方的身份就可能遭到假装

HTTP协议中的请求和相应不会对通讯方进行确认。也就是说存在“服务器是否就是发送请求中URI真正指定的主机，返回的响应是否真的返回到实际提出请求的客户端”等相似问题。
在HTTP协议通讯时，因为不存在确认通讯方的处理步骤，任何人均可以发送请求，同时，服务器只要接收到请求，只要发送端的IP地址和端口号没有被Web服务器设定限制访问，无论对方是谁都会返回一个响应，所以会存在如下各类隐患：小程序

没法肯定请求发送至目标的Web服务器是不是按真实意图返回响应的那台服务器，有多是已假装的Web服务器。
没法肯定响应返回到的客户端是不是按真实意图接收响应的那个客户端，有多是已假装的客户端。
没法肯定正在通讯的对方是否具有访问权限。由于某些Web服务器上保存着重要的信息，指向发给特定用户通讯的权限。
没法断定请求是来自何方、出自谁手。
及时是无心义的请求也会照单全收。没法阻止海量请求下的DoS攻击（Denial of Service,拒绝服务攻击）。

3. 没法证实报文的完整性，可能已遭到篡改

所谓完整性是指信息的准确度。若没法证实其完整性，一般也就意味着没法判断信息是否准确。
所以，在请求或响应送出以后知道对方接收以前的这段时间内，即便请求或相应的内容遭到篡改，也没有办法获悉。
换句话说，没有任何办法确认，发出的请求、响应和接收到的请求、响应是先后相同的。文件内容在传输中可能已经被村改成其余内容，像这样，请求或响应在传输途中遭攻击者拦截并篡改内容的攻击成为中间人攻击（Man-in-the-Middle attack,MITM)。微信小程序

解决：HTTP + 加密 + 认证 + 完整性保护 = HTTPS

上面提了那么多HTTP的缺点天然在HTTPS中咱们得解决它，下面咱们来看看HTTPS是如何保证咱们数据传输安全的。浏览器

1. HTTPS实际上是身披SSL外壳的HTTP

HTTPS并不是是应用层的一种新协议。知识HTTP通讯接口部分用SSL(Secure Socket Layer，安全套阶层)和TLS（Transport Layer Security，安全传输层协议)协议代替而已。
一般,HTTP直接和TCP通讯。当使用SSL时，则变成先和SSL通讯，再由SSL和TCP通讯了。简单来讲，与SSL组合使用的HTTP被称为HTTPS（HTTP Secure,超文本传输安全协议）或HTTP over SSL。
采用了SSL后，HTTP就拥有了HTTPS的加密、证书和完整性保护这些功能。SSL是独立于HTTP的协议，因此不光是HTTP协议，其它运行在应用层的SMTP和Telnet等协议都可配合SSL协议使用。能够说SSL是当今世界上应用最为普遍的网络安全技术。安全

HTTPS的加密原理

近代的加密算法中加密算法是公开的，而密钥是保密的。经过这种方式来保持加密方法的安全性。服务器

加密和解密要用到密钥，若是没有密钥就没有办法对密码解密。换句话来讲，任何人只要持有密钥就可以对密文进行解密。微信

HTTPS在加密过程当中使用了非对称加密技术和对称加密技术。

对称加密算法

采用单钥密码系统的加密方式，同一个密钥能够同时作信息的加密和解密，这种加密的方法称为对称加密，也称为单密钥加密。

下面会把对称加密算法称为共享密钥加密算法。

假如如今，SSL在通讯过程当中，使用了对称加密算法，也就是说客户端和服务器同时共享一个密钥。

因而，以共享密钥的方式加密，必须将密钥发给对方。这个时候，假如通讯过程被监听，密钥被攻击者获取了，那么这个时候也就失去了加密的意义了。

那么，有没有办法解决这个问题呢？答案是确定的，也就是使用两把密钥。

下面先看使用两把密钥的非对称加密算法。

非对称加密算法

与对称加密算法相反，非对称加密算法须要两个密钥来进行加密和解密，这两个密钥是配对的，分别是公开密钥（公钥）和私有密钥（私钥）。

通常状况下，公钥是能够被公开的，它主要用来加密明文。而相应的，私钥不能被公开，用来解密公钥加密的密文。

值得注意的是：公钥加密后的密文只能经过对应的私钥来解密，而私钥加密的密文却能够经过对应的公钥来解密。

以上，公钥加密私钥解密用来加密，私钥加密公钥解密用来签名。相关用途后面会讲到。

下面会把非对称加密算法称为公开密钥加密算法。

因而如今，假设如今由服务器来生成一对公钥和密钥。

当客户端第一次发请求和服务器协商的时候，服务器就生成了一对公钥和私钥。

紧接着，服务器把公钥发给客户端（明文，不须要作任何加密），客户端接收后，随机生成一个密钥，使用服务器发过来的公钥进行加密。

再接着，客户端把使用公钥加密的密钥发给服务器，服务器接收到了之后，用配对的私钥进行解密，就获得了客户端随机生成的那个密钥。

这个时候，客户端和服务端所持的密钥都是相同的。此时，交换密钥环节就完成了。

因而通讯开始时就可进行上面所述的共享密钥加密方式来进行加密。

同时使用

可能，有小伙伴就会问，为何要大费周章使用非对称加密的方式，而后再获得相同的密钥，进行共享密钥加密的通讯呢？

因为公开密钥加密处理起来比共享密钥加密方式更为复杂，所以在通讯的时候使用公开密钥加密的方式，效率很低。

因而，咱们须要使用非对称加密的方式来保证密钥共享的过程当中密钥的安全性，然后在通讯的过程当中使用对称加密算法，这是最合理的设计方式，在保证安全性的同时又保证了性能。

因此，HTTPS采用共享密钥加密和公开密钥加密二者并用的混合加密机制。在交换密钥使用环节使用公开密钥加密方式，以后创建的通讯交换报文阶段则使用共享密钥加密方式。

以上，大概就是使用对称加密和非对称加密的过程。看似过程很完美，其实还存在着一个问题，就是：如何保证服务器传过来的公开密钥的正确性。换句话说，就是保证它不被拦截篡改。

使用证书保证公钥的正确性

假如如今正准备和某台服务器创建公开密钥加密方式下的通讯，如何证实客户端收到的公开密钥就是本来预想的那台服务器发行的公开密钥呢？或许，在公开密钥传输的过程当中，真正的公开密钥可能已经被攻击者替换掉了。

为了解决这个问题，可使用由数字证书机构和其相关颁发的公开密钥证书。

下面阐述一下数字证书认证机构（简称CA）的业务流程：

首先，服务器的运营人员向数字证书机构提出公开密钥的申请。数字证书认证机构在判明提出申请者的身份以后，会对已申请的公开密钥作数字签名，而后分配这个已签名的公开密钥，并将该公开密钥放入公钥证书后绑定在一块儿。

咱们用白话文来翻译一下上面这段话：
首先，CA会向申请者颁发一个证书，这个证书里面的内容有：签发者、证书用途、服务器申请的时候附带的公钥、服务器的加密算法、使用的HASH算法、证书到期的时间等等。
紧接着，把上面所提到的内容，作一次HASH求值，获得一个HASH值。

再接着，用CA的私钥进行加密，这样就完成了数字签名。而用CA的私钥加密后，就生成了相似人体指纹的签名，任何篡改证书的尝试，都会被数字签名发现。
最后，把数字签名，附在数字证书的末尾，传输回来给服务器。
接下来，服务器会把这份由数字证书认证机构颁发的公钥证书发给客户端。这个时候，客户端可使用数字证书机构的公开密钥对其进行验证。一旦验证成功，客户端便可以肯定这个公开密钥是可信的。

咱们再用白话文来翻译一下：
客户端拿到这个数字证书之后，用CA私钥对应的公钥，能够解密数字证书末尾的数字签名，获得原始的HASH值。
紧接着，客户端按照证书中的HASH算法，对证书的内容求HASH值。若是经过CA公钥解密的HASH和经过计算求得的HASH值相同，那么认证经过，不然失败。
若是认证经过，就能够取得服务器的公开密钥。

那客户端上面的CA公钥是从哪里来的呢？
多数浏览器开发商发布版本时，会事先在内部植入经常使用认证机关的公开密钥。这样，就方便客户端对于数字证书真实性的验证。

其具体过程是这样子的（图中简化了数字签名的过程）：

这里其实就用到了非对称加密算法，只不过如今这个加密算法用来签名而不是加密。

使用私钥加密，公钥解密，用于公钥的持有者验证经过私钥加密的内容是否被篡改，可是不用来保证内容是否被他人得到。

而使用公钥加密，私钥解密，则是相反的，它不保证信息被他人截获篡改，可是保证信息没法被中间人得到。

客户端证书

HTTPS中不只可使用服务器证书，还可使用客户端证书。以客户端证书进行客户端认证，它的做用与服务器证书是相同的。

因为客户端获取证书须要用户自行安装客户端证书，同时也面临着费用的问题。

所以，现状是，安全性极高的认证机构可办法客户端证书可是仅用于特殊用途的业务。好比那些可支撑客户端证书支出费用的业务。

例如，银行的网上银行就采用了客户端证书。在登陆网银时不只要求用户确认输入ID和密码，还会要求用户的客户端证书，以确认用户是否从特定的终端访问网银。

HTTPS的安全通讯机制

为了更好的理解HTTPS，小肆给你们画了下图来一块儿观察一下HTTPS的通讯步骤：

步骤1：客户端经过发送Client Hello报文开始SSL通讯。报文中包含客户端支持的SSL的指定版本、加密组件列表（所使用的加密算法及密钥长度等）。

步骤2：服务器可进行SSL通讯时，会以Server Hello报文做为应答。和客户端同样，在报文中包含SSL版本以及加密组件。服务器的加密组件内容是从接收到的客户端加密组件内筛选出来的。

步骤3：以后服务器发送Certificate报文。报文中包含公开密钥证书。

步骤4：最后服务器发送Server Hello Done报文通知客户端，最初阶段的SSL握手协商部分结束。

步骤5：SSL第一次握手结束以后，客户端以Client Key Exchange报文最为回应。报文中包含通讯加密中使用的一种被称为Pre-master secret的随机密码串。该报文已用步骤3中的公开密钥进行加密。

步骤6：接着客户端继续发送Change Cipher Spec报文。该报文会提示服务器，在此报文以后的通讯会采用Pre-master secret密钥加密。

步骤7：客户端发送Finished报文。该报文包含链接至今所有报文的总体效验值。此次握手协商是否可以成功，要以服务器是否可以正确解密该报文做为断定标准。

步骤8：服务器一样发送Change Cipher Spec报文。

步骤9：服务器一样发送Finished报文。

步骤10：服务器和客户端的Finished报文交换完毕以后，SSL链接就算创建完成，固然，通讯会受到SSL的保护。今后处开始进行应用层协议的通讯，即发送HTTP请求。

步骤11：应用层协议通讯，即发送HTTP响应。

步骤12：最后由客户端断开链接。断开链接时，发送close_notify报文。上图作了一些省略，这步以后再发送TCP FIN报文来关闭与TCP的通讯。

在以上流程中，应用层发送数据时会附加一种叫作MAC（Message Authentication Code）的报文摘要。MAC可以查知报文是否遭到篡改，从而保护报文的完整性。

那如今有一个问题，整个过程当中产生的三个随机数有什么用呢？还有，后面进行HTTP通讯的时候，是用哪个密钥进行加密，还有怎么保证报文的完整性。

看下面这张图。

对于客户端：

当其生成了Pre-master secret以后，会结合原来的A、B随机数，用DH算法计算出一个master secret，紧接着根据这个master secret推导出hash secret和session secret。

对于服务端：

当其解密得到了Pre-master secret以后，会结合原来的A、B随机数，用DH算法计算出一个master secret，紧接着根据这个master secret推导出hash secret和session secret。

在客户端和服务端的master secret是依据三个随机数推导出来的，它是不会在网络上传输的，只有双方知道，不会有第三者知道。同时，客户端推导出来的session secret和hash secret与服务端也是彻底同样的。

那么如今双方若是开始使用对称算法加密来进行通信，使用哪一个做为共享的密钥呢？过程是这样子的：

双方使用对称加密算法进行加密，用hash secret对HTTP报文作一次运算生成一个MAC，附在HTTP报文的后面，而后用session-secret加密全部数据（HTTP+MAC），而后发送。

接收方则先用session-secret解密数据，而后获得HTTP+MAC，再用相同的算法计算出本身的MAC，若是两个MAC相等，证实数据没有被篡改。

至此，整个过程介绍完毕。