关于大厂面试中问到的二十几个 HTTP 面试题

我在 github 上新建了一个仓库 日问,天天一道面试题,有关前端,后端,devops以及软技能,促进职业成长,敲开大厂之门,欢迎交流css

而且记录个人面试经验html

分类

计算机与编程基础

计算机网络 |
算法与数据结构 |
操做系统 |
Linux基础 |
http |
vim |
git前端

前端

CSS |
Javascript |
html |
React |
Vue |
Webpack |
前端工程化vue

后端

后端基础 |
数据库 |
Redis |
微服务架构node

DevOps

DevOps |
Docker |
kubernetespython

开放式问题

开放式问题react

历史记录

查看全部问题linux

【Q035】http 常见的状态码有哪些

在 Issue 中交流与讨论: 答案解析
  • 1XX 表示消息
  • 2XX 表示成功
  • 3XX 表示重定向
  • 4XX 表示客户端错误
  • 5XX 表示服务端错误
常见的状态码
  • 200
最喜欢见到的状态码,表示请求成功
  • 301
永久重定向
  • 302
临时重定向
  • 304
自上次请求,未修改的文件
  • 400
错误的请求
  • 401
未被受权,须要身份验证,例如token信息等等
  • 403
请求被拒绝
  • 404
资源缺失,接口不存在,或请求的文件不存在等等
  • 500
服务器端的未知错误
  • 502
网关错误
  • 503
服务暂时没法使用

【Q036】http 状态码中 301,302和307有什么区别

在 Issue 中交流与讨论: 答案解析
  • 301,Moved Permanently。永久重定向,该操做比较危险,须要谨慎操做:若是设置了301,可是一段时间后又想取消,可是浏览器中已经有了缓存,仍是会重定向。
  • 302,Fount。临时重定向,可是会在重定向的时候改变 method: 把 POST 改为 GET,因而有了 307
  • 307,Temporary Redirect。临时重定向,在重定向时不会改变 method

【Q050】http 状态码 502 和 504 有什么区别

在 Issue 中交流与讨论: 答案解析
  • 502 Bad Gateway

The server was acting as a gateway or proxy and received an invalid response from the upstream server.
收到了上游响应但没法解析webpack

  • 504 Gateway Timeout

The server was acting as a gateway or proxy and did not receive a timely response from the upstream server.
上游响应超时nginx

【Q079】简述 http 的缓存机制

在 Issue 中交流与讨论: 答案解析

【Q081】http proxy 的原理是什么

<blockquote> 更多描述: 如 webpack-dev-server 能够设置 proxy,nginx 也能够设置 </blockquote>

在 Issue 中交流与讨论: 答案解析

todo

【Q084】随着 http2 的发展,前端性能优化中的哪些传统方案能够被替代

在 Issue 中交流与讨论: 答案解析
  1. 雪碧图
  2. 资源文件合并

【Q085】http2 与 http1.1 有什么不一样

在 Issue 中交流与讨论: 答案解析

【Q107】什么是 Basic Auth 和 Digest Auth

在 Issue 中交流与讨论: 答案解析

【Q108】gzip 的原理是什么

在 Issue 中交流与讨论: 答案解析

gzip 使用了 LZ77 算法与 Huffman 编码来压缩文件,重复度越高的文件可压缩的空间就越大。

【Q109】能够对图片开启 gzip 压缩吗,为何

在 Issue 中交流与讨论: 答案解析

不须要开启,若是开启的话,有可能使图片变的更大。若是你注意一些网站的 img 资源时,就会发现他们都没有开启 gzip

参考: https://webmasters.stackexcha...

Don't use gzip for image or other binary files.

Image file formats supported by the web, as well as videos, PDFs and other binary formats, are already compressed; using gzip on them won't provide any additional benefit, and can actually make them larger. To compress images, see Optimize images.

【Q110】http 的请求报文与响应报文的格式是什么

在 Issue 中交流与讨论: 答案解析

nc 模拟 http 报文以下

$ nc www.baidu.com 80
GET / HTTP/1.1
Host: www.baidu.com

HTTP/1.1 200 OK
Accept-Ranges: bytes
Cache-Control: no-cache
Connection: Keep-Alive
Content-Length: 14615
Content-Type: text/html
Date: Tue, 10 Dec 2019 02:48:44 GMT
P3p: CP=" OTI DSP COR IVA OUR IND COM "
P3p: CP=" OTI DSP COR IVA OUR IND COM "
Pragma: no-cache
Server: BWS/1.1
Set-Cookie: BAIDUID=F0FC6B3A056DEA285F51A1F2F8A170BB:FG=1; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com
Set-Cookie: BIDUPSID=F0FC6B3A056DEA285F51A1F2F8A170BB; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com
Set-Cookie: PSTM=1575946124; expires=Thu, 31-Dec-37 23:55:55 GMT; max-age=2147483647; path=/; domain=.baidu.com
Set-Cookie: BAIDUID=F0FC6B3A056DEA287CB2B9422E09E30E:FG=1; max-age=31536000; expires=Wed, 09-Dec-20 02:48:44 GMT; domain=.baidu.com; path=/; version=1; comment=bd
Traceid: 1575946124058431156210725656341129791126
Vary: Accept-Encoding
X-Ua-Compatible: IE=Edge,chrome=1

<!DOCTYPE html><!--STATUS OK-->
........内容省略

【Q111】http 响应头中的 ETag 值是如何生成的

在 Issue 中交流与讨论: 答案解析

关于 etag 的生成须要知足几个条件

  1. 当文件不会更改时,etag 值保持不变。因此不能单纯使用 inode
  2. 便于计算,不会特别耗 CPU。这样子 hash 不是特别合适
  3. 便于横向扩展,多个 node 上生成的 etag 值一致。这样子 inode 就排除了

关于服务器中 etag 如何生成能够参考 HTTP: Generating ETag Header

那么在 nginx 中的 etag 是如何生成的?

nginx 中 ETag 的生成

我在网上找到一些资料与源代码了解到了 etag 的计算方法。由 python 伪代码表示计算方法以下

etag = '{:x}-{:x}'.format(header.last_modified, header.content_lenth)

源码: ngx_http_core_modules.c

etag->value.len = ngx_sprintf(etag->value.data, "\"%xT-%xO\"",
                                  r->headers_out.last_modified_time,
                                  r->headers_out.content_length_n)
                      - etag->value.data;

总结:nginxetag 由响应头的 Last-ModifiedContent-Length 表示为十六进制组合而成。

随手在个人k8s集群里找个 nginx 服务测试一下

$ curl --head 10.97.109.49
HTTP/1.1 200 OK
Server: nginx/1.16.0
Date: Tue, 10 Dec 2019 06:45:24 GMT
Content-Type: text/html
Content-Length: 612
Last-Modified: Tue, 23 Apr 2019 10:18:21 GMT
Connection: keep-alive
ETag: "5cbee66d-264"
Accept-Ranges: bytes

etag 计算 Last-ModifiedContent-Length,使用 js 计算以下,结果相符

> new Date(parseInt('5cbee66d', 16) * 1000).toJSON()
"2019-04-23T10:18:21.000Z"
> parseInt('264', 16)
612

Last-Modified,ETag 与协商缓存

咱们知道协商缓存有两种方式

  • Last-Modified/if-Modified-Since
  • ETag/If-None-Match

既然在 nginxETagLast-ModifiedContent-Length 组成,那它便算是一个增强版的 Last-Modified 了,那增强在什么地方呢?

Last-Modified 是由一个 unix timestamp 表示,则意味着它只能做用于秒级的改变

那下一个问题:若是 http 响应头中 ETag 值改变了,是否意味着文件内容必定已经更改

【Q112】若是 http 响应头中 ETag 值改变了,是否意味着文件内容必定已经更改

在 Issue 中交流与讨论: 答案解析

不必定,由服务器中 ETag 的生成算法决定。详见 #112

好比 nginx 中的 etaglast_modifiedcontent_length 组成,而 last_modified 又由 mtime 组成

当编辑文件却未更改文件内容时,或者 touch filemtime 也会改变,此时 etag 改变,可是文件内容没有更改。

【Q116】http 服务中静态文件的 Last-Modified 是根据什么生成的

在 Issue 中交流与讨论: 答案解析

通常会选文件的 mtime,表示文件内容的修改时间

nginx 也是这样处理的,源码见: ngx_http_static_module.c

r->headers_out.status = NGX_HTTP_OK;
    r->headers_out.content_length_n = of.size;
    r->headers_out.last_modified_time = of.mtime;

关于为何使用 mtime 而非 ctime,能够参考 #116

【Q117】既然 http 是无状态协议,那它是如何保持登陆状态

在 Issue 中交流与讨论: 答案解析

经过 cookie 或者 Authorization header 来传递凭证,在服务端进行认证

【Q119】https 是如何保证报文安全的

在 Issue 中交流与讨论: 答案解析

https主要解决三个安全问题:

  1. 内容隐私
  2. 防篡改
  3. 确认对方身份

https并非直接经过非对称加密传输过程,而是有握手过程,握手过程主要是和服务器作通信,生成私有秘钥,最后经过该秘钥对称加密传输数据。还有验证证书的正确性。
证书验证过程保证了对方是合法的,而且中间人没法经过伪造证书方式进行攻击。

【Q121】咱们如何从 http 的报文中得知该服务使用的技术栈

在 Issue 中交流与讨论: 答案解析

通常有两个 response header,有时服务端为了隐蔽本身真实的技术栈会隐蔽这两个字段

  • X-Powerd-By
  • Server

【Q122】在发送 http 请求报文时,Host 是必要的吗

在 Issue 中交流与讨论: 答案解析

是有必要的,由于咱们不知道会途径会不会有代理出现, 若是直接到达服务器的话,服务器是能够经过路径知道资源在哪,可是若是经过代理的话,代理没法得知具体服务器是什么地址

【Q133】http 响应头中若是 content-type 为 application/octet-stream,则表明什么意思

在 Issue 中交流与讨论: 答案解析

表明二进制流,通常用如下载文件

【Q136】http 向 https 作重定向应该使用哪一个状态码

在 Issue 中交流与讨论: 答案解析

通常用做 301 的较为多,可是也有使用 302,若是开启了 HSTS 则会使用 307

如知乎使用了 302,淘宝使用了 301

$ curl --head www.zhihu.com
HTTP/1.1 302 Found
Date: Tue, 24 Dec 2019 00:13:54 GMT
Content-Length: 22
Connection: keep-alive
Server: NWS_TCloud_IPV6
Location: https://www.zhihu.com/
X-NWS-LOG-UUID: 0e28d9a1-6aeb-42cd-9f6b-00bd6cf11500

$ curl --head www.taobao.com
HTTP/1.1 301 Moved Permanently
Server: Tengine
Date: Tue, 24 Dec 2019 00:13:58 GMT
Content-Type: text/html
Content-Length: 278
Connection: keep-alive
Location: https://www.taobao.com/
Via: cache20.cn1480[,0]
Timing-Allow-Origin: *
EagleId: 6f3f38a815771464380412555e

【Q141】http 响应头中的 Date 与 Last-Modified 有什么不一样,网站部署时须要注意什么

在 Issue 中交流与讨论: 答案解析

LM-Factor 与它俩有关。

简而言之,一个静态资源没有设置 Cache-Control 时会以这两个响应头来设置强制缓存时间,而非直接进行协商缓存。在涉及到 CDN 时,表现更为明显,体如今更新代码部署后,界面没有更新。

【Q144】http 1.1 中的 keep-alive 有什么做用

在 Issue 中交流与讨论: 答案解析

http 1.1 中,在响应头中设置 keep-alive 能够在一个 TCP 链接上发送多个 http 请求

  1. 避免了重开 TCP 链接的开销
  2. 避免了刷新时从新创建 SSL 链接的开销
  3. 避免了QPS过大时,服务器的链接数过大

在服务器端使用响应头开启 keep-alive

Connection: Keep-Alive
Keep-Alive: timeout=5, max=1000
我是山月,能够加我微信 shanyue94 与我交流,备注交流。另外能够关注个人公众号【全栈成长之路】

若是你对全栈面试,前端工程化,graphql,devops,我的服务器运维以及微服务感兴趣的话,能够关注我

相关文章
相关标签/搜索