「真®全栈之路」Web前端开发的后端指南

前言

在若干次前的一场面试,面试官看我作过python爬虫/后端 的工做,顺带问了我些后端相关的问题:你以为什么是后端?php

送命题。当时脑瓦特了,答曰:逻辑处理和数据增删改查。。。html

当场被怼得体无完肤,羞愧难当。过后再反思这问题,结合资料总结了一下。发现本身学过的 RedisElasticsearchDNS等其实都属于后端知识体系范畴。

在本文中,我将尝试总结前端须知的后端体系入门前端

不管你的动机是什么,这个体系里都有你想要了解或学习的东西:vue

  • 存储和服务如何结合在一块儿?
  • 何时(或为何)我须要用到这个?
  • 全栈之路该怎么走?
  • 各技术的主流框架选择

本文目录node

  1. Web / Application Servers
  2. 负载均衡器: Load Balancer
  3. 域名解析系统,DNS
  4. HTTPS / SSL证书
  5. 数据库,Database
  6. Blob / 文件存储
  7. 内容分发网络(CDN)
  8. 缓存服务:Caching Service
  9. 消息队列:Message queue

1. Web / Application Servers

  • Web Servers服务器:Web服务器,使用http协议向Web提供内容。
  • Application Servers:应用程序服务器,托管并公开业务逻辑和进程。

1.1 服务器端语言

可使用不一样的服务器端语言编写代码:

  • 例如Node.js,Python,PHP,Java,C#Ruby
  • 每种语言都有本身的“Web框架”(例如基于 Java 的 Spring,基于 Ruby 的 Rails,基于C#的ASP.NET MVC或基于Node.js的Express)。
  • 这些框架使开发人员可以编写更少的代码来处理数据请求。

1.2 后端语言选择

而事实上,每一个后端语言都有不同的特性,也都有各自的拥护者。哪个语言最适合作为后端语言的入门一直都是没有定论的问题。但为了让咱们能够对各语言有一个很简单的概念,如下整理了各语言较常被说起的特点、在开发上比较被人诟病的点,以及有什么样的网站是透过该语言开发的:python

PHPnginx

  • 使用者多,算是最普及的后端语言。
  • 简单易学,但因一些古老的设计饱受批评。
  • 网站范例:FacebookWordpress、新浪微博。

Javagit

  • 老牌语言,开发统治者。国内外工做需求稳定,应用层面广。
  • 开发相较起来较慢,没那麽适合新手。
  • 网站范例:LinkedinAmazon、淘宝。

Rubygithub

  • 开发快速,国内外不少 bootcamp 都以此语言教后端。
  • 适不适合新手学饱受争议。
  • 网站范例:AirbnbTwitter

Python:web

  • 语法简单易学,数据分析与资料探勘相关应用多。
  • 单独使用 Python 相较起来运行性能较差。
  • 网站范例:InstagramReddit、知乎。

JavaScript (Node.js):

  • 前端后端均可用 JS,高并发的状况执行效率极高
  • 不适合 CPU 密集的应用
  • 初创型企业首选
  • 网站范例:YahooWalmart

Go:

  • Google力推,有很完善的标准库,效能强大堪比C系列。
  • 目前学习资源较少(感谢伟大B站的付出,真香)
  • 网站范例:GoogleYoutube、哔哩哔哩、头条、腾讯云

1.2 Web服务器

Web Server,除了托管自定义应用程序代码以外,一些Web应用程序体系结构还使用“Web服务器进程”,例如 Apache HTTP ServerNginx。这些服务器进程将在访问后端代码以前拦截客户端请求。使用它们有如下几个缘由:

  • 快速重定向某些请求而没必要经过后端代码执行此操做(状态码404页面)。
  • 存储在Web服务器的文件系统上的静态内容(例如图像,CSSJS)比经过后端代码访问更快。
  • 某些服务器端语言(例如PHP)没有内置的生产级Web服务器,所以须要经过专用的Web服务器进程启动。

至此,会引出一个疑问:ApacheNginxTomcatNode.js四者的区别是什么?

引用:apache、node.js、nginx、tomcat谁能帮我捋一捋关系?

是一类东西,又不是一类东西。

首先它们都能建立 Web服务器,可是他们关注的点不同。

  • Tomcat 只能跟 Java配合,Node.js只能跟JavaScript
  • Apache 能和其余语言配合(一般跟 PHP 配合居多),但须要借助不一样的模块。
  • Nginx则是经过端口转发,因此ApacheNginx能够和各类编程语言一块儿使用
  • NginxApache是纯web服务器,不具有解析动态语言(好比php文件和js文件)的能力.
  • TomcatNode.js 可以解析这些脚本语言,提供应用服务,Web Server算是附加的功能。

1.3 web服务器的形式(载体)

安装这些工具和后端项目的Web服务器计算机,自己能够采用如下几种形式:

  • 一台物理机器
  • 虚拟专用服务器,即咱们一般所说的VPS(例如华为云,阿里云等)

VPS其实是被划分为几个部分的独立服务器,每一个部分做为单独的VPS服务器进行销售和使用。也就是说,它是一台可运行多个Web应用程序(网站、软件等)的相对独立的机器,每一个用户拥有部分资源。

  • 托管虚拟机实例(例如AWS EC2,Google Compute Engine)
  • 平台即服务(PaaS)主机,云服务提供商(例如Heroku,AWS Elastic Beanstalk)

VPS是基于软件层的虚拟化技术,具体来讲就是操做系统的虚拟化,VM是基于硬件层的虚拟化技术,VM主机使用vmware server搭建。

1.4 Dokcer,虚拟机与物理机

docker容器与虚拟机有什么区别?

用个类比来极简说明一下:

1. 物理机是这样的:

2. 虚拟机是这样的:

3. Dokcer是这样的:

2. 负载均衡器: Load Balancer

负载均衡是高可用网络基础架构的的一个关键组成部分,有了负载均衡,咱们一般能够将咱们的应用服务器部署多台,而后经过负载均衡将用户的请求分发到不一样的服务器用来提升网站、应用、数据库或其余服务的性能以及可靠性。

负载平衡器模型一般分为两类:第4层(传输层)和第7层(应用层)。

第4层(传输层):

  • 根据网络和传输层协议(IP,TCP,FTP,UDP)中的数据进行操做。
  • 不认识http协议,对应其余TCP应用,例如基于C/S开发的ERP等系统。

第7层(应用层):

  • 根据应用层协议(如HTTP)中的数据分发请求。
  • 认识http协议,因此其应用范围主要是众多的网站或者内部信息平台等基于B/S开发的系统。

负载均衡器主要分为硬件负载均衡和软件负载均衡两大类。

  • 硬件负载均衡: 对应第四层,如F5负载均衡器
  • 软件负载均衡: 对应第七层,如LVSNginxHAproxy

两种类型的负载平衡器都会收到请求,并根据配置的算法将这些请求分发到特定的服务器。一些行业标准算法是:

  • 轮询调度,Round robin,RR
  • 加权轮询,Weighted round robin,WRB
  • 最少链接数,Least connections
  • 最短的响应时间,Least response time

Web应用程序中使用负载均衡器有两个主要好处:

  • 它经过确保单个Web服务器不会被全部请求淹没,来帮助维持一致的响应时间,所以处理每一个请求的速度会相对慢些。
  • 它保持高可用性。若是服务器崩溃,全部后续客户端请求仍将成功,由于它们将路由到健康的服务器,而且用户不会发现任何问题。

3. 域名解析系统,DNS

当用户在其地址栏中输入URL时,浏览器将获取URL的域部分(例如www.google.com)并调用DNS 。DNS解析发回该网站服务器的IP地址位置(例如172.217.23.4)。一旦它具备IP地址,它就能够发送对网页的实际请求。

  • 若是你的Web应用程序使用负载均衡器,则应将域名配置为指向负载均衡器的域名或IP地址。
  • 若是您没有使用负载均衡器,那么您能够将域名直接指向应用程序服务器的域名/ IP地址。

大多数互联网域名注册服务(例如GoDaddy,万网等)都提供DNS管理控制台。这些容许你配置域名(和子域)以指向应用程序的位置。

若是你愿意,还能够将您的域名服务器转移到阿里云、腾讯云等云提供商,并从那里进行管理。这样作的好处是能够将全部应用程序环境配置保存在一个位置,并使其更易于自动化。

4. HTTPS / SSL证书

若是你正在构建Web应用程序(或静态网站),则须要经过HTTPS提供服务,以确保用户与服务器之间的安全通讯。如今使用HTTPS 也有SEO的好处,因此没有理由不使用它。

这意味着须要在后端安装SSL证书。具体来讲,须要在任何服务器上安装它们,这是客户端请求的第一个联系点。这一般意味着负载均衡器和CDN服务器,但若是你没有使用负载均衡器,也多是应用程序服务器。

  • 你可使用LetsEncrypt免费生成证书。
  • 若是你使用的是云基础架构,则可使用托管服务,例如AWS Certificate Manager。这容许你建立并自动续订SSL证书并将其分发到应用程序服务器,负载平衡器和CDN服务器。
  • 只有中大型的HTTPS证书受权中心才会被浏览器认可,不然会显示为不安全,须要手动信任。

目前SSL证书根据验证级别分为三种类型

  • 域名型SSL证书,简称DV SSL
  • 企业型SSL证书,简称OV SSL
  • 加强型SSL证书,简称EV SSL。
  • 它们之间都有必定的区别,认证级别也都不一样,各自适合不一样规模类型的网站安装。

通常状况下,企业类网站使用的OV SSL证书比较多,并且价格也适中,在大众用户可接受范围内。

5. 数据库,Database

几乎全部Web应用程序都须要在某处保留数据。在大多数状况下,某处即某种形式的数据库。 数据库的主要工做是将数据可靠地保存到永久存储器中,并容许经过查询检索数据。它还能够围绕它存储的数据结构强制执行一些规则约束。

5.1 数据库的种类

早期比较流行的数据库模型有三种,分别为层次式数据库、网络式数据库和关系型数据库。

而在当今的互联网中,最经常使用的数据库模型主要是两种,即关系型(SQL)数据库和非关系型(NoSQL)数据库。

  • 关系数据库(例如MySql,Postgres,SQLServer,Oracle,SQLite)已经存在了40多年,而且一直是大多数Web应用程序的支柱。
  • 而在过去十年左右的时间里,NoSQL数据库(例如MongoDB,Cassandra,CouchDB,DynamoDB)在Web应用程序中变得愈来愈广泛,主要是由于它们具备可扩展性优点和数据结构灵活性。

5.2 数据库部署

你能够在一台服务器上托管数据库,但在生产方案中更常见的是将其托管在某种形式的集群2台或更多服务器上。这可确保数据库具备高可用性并下降数据丢失的风险,例如,若是一台服务器的存储损坏。

近年来,少数云托管的“无服务器数据库”已经可用。这些是能够经过API调用的数据库,但你无需设置服务器来托管它们。除了处理诸如自动备份之类的事情以外,云供应商还为您无形地执行此操做。这些示例包括DynamoDB(NoSQL)Firebase实时数据库(NoSQL)和Aurora无服务器(关系)。

5.3 数据库基础方案

来源:架构设计之「数据库从主备到主主的高可用方案」

不管底层是关系型数据库,仍是NoSQL数据库,不管是 Mysql 仍是 Redis、MongoDB,在架构设计上都是相通的。

数据库服务器的基础方案分为三种:

  • 一主一备的架构(主备式)
  • 一主一从的架构(主从式)
  • 互为主从的架构(主主式)

1. 一主一备的架构(主备式)

主备式架构是双机部署中最简单的一种架构,几乎市面上全部的数据库系统都会自带这个主备功能。

其思路也特别的简单:

  • 将数据库部署到两台机器,其中一台机器(代号A)做为平常提供数据读写服务的机器,称为「主机」。
  • 另一台机器(代号B)并不提供线上服务,但会实时的将「主机」的数据同步过来,称为「备机」。
  • 一旦「主机」出了故障,经过人工的方式,手动的将「主机」踢下线,将「备机」改成「主机」来继续提供服务。

这个架构的优缺点都很明显,优势就是几乎不须要作什么开发改造,各种数据库就支持这种模式,部署维护起来也简单,并无引入额外的系统复杂度和瓶颈。

可是缺点呢,就是当「主机」出现故障的时候,须要人工去干预啊,运维同窗很辛苦的,并且处理还不必定及时。再还有一个缺点就是,主备架构会形成严重浪费资源,毕竟须要一台与「主机」同等配置的「备机」长期备着,但又不做为线上服务来使用,你说浪费不浪费。

为了解决这个资源浪费问题,咱们就得想一个把「备机」也用起来的方案:主从式架构。

2. 一主一从的架构(主从式)

主从式架构大致上与上述的主备式架构差很少。区别就是主备式的「备机」平时是不干活的的,主要起到备份的做用。而主从式的「备机」改成了「从机」,平时也要提供服务,跟「主机」同样随时随刻的在干活的。

  1. 主从式架构中的「从机」虽然也在随时随刻提供服务,可是它只提供「读」服务,并不提供「写」服务。
  2. 「主机」会实时的将线上数据同步到「从机」,以保证「从机」可以正常的提供读操做。
  3. 这种架构相比较主备式,对资源是一种节约,毕竟「从机」也在提供服务,没有白白的浪费。而且在「主机」出现故障时,在人工介入以前,好歹「从机」也是可以提供数据的「读」操做的,毕竟大多数业务都是「读」多「写」少,所以对稳定性又提升了一个层次。
  4. 缺点就是架构稍微复杂了一点,毕竟「主机」和「从机」都有「读」服务,那么前端业务系统就须要用必定策略去判断该路由到哪一台去读取数据。还有就是,延迟问题,「主机」的数据同步到「从机」不免会有必定程度的延迟,这个延迟可能会对数据实时性要求较高的业务有必定影响。

3. 互为主从的架构(主主式)

互为主从的架构是指两台机器本身都是主机,而且也都是做为对方的从机。两台机器都提供完整的读写服务,所以无需切换,客户机在调用的时候随机挑选一台便可,当其中一台宕机了,另一台还能够继续服务。

  • 采用 互为主从架构 有个复杂点就是,由于两台主机都接受写数据,那就须要将写的最新数据实时的同步给对方,须要将数据进行两台主机的双向复制。
  • 而双向复制不可避免的会在必定程度上带来数据延迟、极端状况下甚至有数据丢失等问题。
  • 在实际业务中,有些业务数据对一致性要求是很是高的,并不能接受数据的延迟、丢失,所以这类业务也不适合互为主从的模式,好比金融业务。
  • 可是咱们互联网业务中大多数场景仍是没有这么高要求的,因此这种模式对于通常场景仍是用的蛮多。

至于数据库集群方案,我暂时没看懂,就不写了。。。

6. Blob / 文件存储

虽然数据库一般用于存储动态数据(例如,由最终用户或API客户端生成),可是存在某些类别的数据( 非结构化数据),这些数据不能由用户改变或者基于文件而不适合数据库存储,例如:

  • 前端网站资源,如图像,JavascriptCSS,字体,音频,视频文件。
  • 用户经过表单上传的各种文件。

云服务供应商不是将这些存储在数据库中,而是提供专用服务来存储这些服务,例如AWS Simple Storage Service(S3)AzureGoogle Cloud Storage和阿里云OSS等。

这样作的好处是云供应商能够安全地存储文件,并能够为其制做冗余副本,以最大限度地下降数据丢失的风险。

6.1 关于 Blob 存储:

Blob 存储用于:

  • 直接向浏览器提供图像或文档。
  • 存储文件以供分布式访问。
  • 对视频和音频进行流式处理。
  • 向日志文件进行写入。
  • 存储用于备份和还原、灾难恢复及存档的数据。
  • 存储数据以供本地或 Azure 托管服务执行分析

7. 内容分发网络(CDN)

Blob /文件存储服务容许客户端经过HTTP端点访问文件。例如,您的Web应用程序的HTML标记能够简单地连接到AWS S3中存储的图像和CSS文件的URL。 传统网络访问

可是,假设个人用户位于中国,个人S3存储位于美国西部 - 数据传输距离数千英里,所以个人用户会看到延迟。

CDN是什么?使用CDN有什么优点?

  • CDN是云供应商提供的服务,它们在全球范围内分布有“边缘服务器”。
  • 这些边缘服务器从“原点”(例如,blob /文件存储位置)获取文件的副本。你的前端Web应用程序将指向 其CDN URL,而不是指向静态资产的Blob存储URL。
  • 如今,客户端和“边缘”之间的距离远不是几千英里的往返,而是更少,所以文件的获取速度更快。

使用了CDN的网站访问:

7.1 CDN工做流

经过权威DNS服务器来实现最优节点的选择,经过缓存来减小源站的压力。

8. 缓存服务:Caching Service

虽然CDN是静态文件的一种缓存形式,但Web应用程序可能须要临时缓存动态数据。

例如,假设存在一个数据库查询,该查询对昨天的数据执行计算,其结果天天常常被成千上万的用户访问。每次用户请求此数据时联系数据库就没有任何意义。

对此的解决方案是使用高速缓存服务在第一个用户请求以后将结果存储一段时间。经过缓存将更快地提供对该数据的后续请求。

缓存服务本质上是一种特殊类型的数据库。 缓存采用键值存储的形式,其中键是应用程序代码用于查询数据的字符串(例如DailySiteStats_2018-10-17),值是缓存的实际数据。缓存的数据一般彻底保存在内存中,这使得从缓存中检索数据的速度很是快。

常见的缓存服务是RedisMemcached。AWS经过其Elasticache服务提供这二者的托管版本。

8.1 RedisMemcached对比

RedisMemcached是都是主流的开源内存数据存储。虽然它们既易于使用又提供高性能,但在选择引擎时须要考虑重要的差别。Memcached是为简单而设计的,而Redis提供了丰富的功能,使其可以普遍用于各类用例。

Memcached Redis
亚毫秒级延迟
开发人员易用性
数据分区
多语言支持
高级数据结构 -
多线程架构 -
快照 -
复制 -
发布/订阅 -
Lua脚本 -
地理空间支持 -

亚毫秒级延迟:

RedisMemcached都支持亚毫秒的响应时间。经过将数据存储在内存中,它们能够比基于磁盘的数据库更快地读取数据。

开发人员易用性:

RedisMemcached在语法上都很容易使用,而且须要最少许的代码才能集成到您的应用程序中。

数据分区:

Redis和Memcached`都容许您在多个节点之间分发数据。这容许您在需求增加时向外扩展以更好地处理更多数据。

支持普遍的编程语言:

RedisMemcached都有许多面向开发人员的开源客户端。支持的语言包括Java,Python,PHP,C,C ++,C#,JavaScript,Node.js,Ruby,Go等等。

高级数据结构:

除了字符串,Redis还支持列表,集合,有序集,哈希,位数组等。应用程序可使用这些更高级的数据结构来支持各类用例。例如,你可使用Redis排序集轻松实现游戏排行榜,该排行榜保持按其排名排序的玩家列表。

多线程架构

因为Memcached是多线程的,所以它可使用多个处理核心。这意味着您能够经过扩展计算容量来处理更多操做。

快照:

使用Redis,您可使用即时快照将数据保存在磁盘上,该快照可用于存档或恢复。

复制:

Redis容许您建立Redis主数据库的多个副本。这容许您扩展数据库读取并具备高可用性集群。

发布/订阅:

Redis支持使用模式匹配的Pub /Sub消息传递,您能够将其用于高性能聊天室,实时评论流,社交媒体源和服务器互通。

Lua脚本:

Redis容许您执行事务性Lua脚本。脚本能够帮助您提升性能并简化应用程序。

地理空间支持:

Redis具备专门用于大规模处理实时地理空间数据的命令。您能够执行诸如查找两个元素(例如人或地点)之间的距离以及查找点的给定距离内的全部元素之类的操做。

9. 消息队列:Message queue

适用于批处理任务和分离应用程序的异步消息收发

有时,你程序须要执行的任务与响应用户请求没有直接关系。

例如,假设用户上传了须要编码和水印的视频。但这是一项长期运行的任务,所以让用户在完成时等待是没有意义的。更好的方法是异步执行此操做。您的网络应用程序代码会在队列中建立一条做业消息,并通知您的用户,当水印视频准备就绪时,他们将收到一封电子邮件(消息)。

而后,你将拥有一个能够执行如下操做的工做任务流:

  1. 从队列中读取消息。
  2. 开始处理视频。
  3. 完成后,保存视频的编码副本。
  4. 向用户发送通知电子邮件(消息)。
  5. 从队列中删除消息。

这里有2个架构组件:

您能够经过如下几种方式实现worker任务:

  • 调度CRON做业以触发应用程序服务器上安装的指定代码,以便按特定计划从队列中读取。
  • 将消息添加到队列时,使用FaaS平台调用工做器代码。

9.1 Message queue 简介

消息队列是一种异步的服务间通讯方式,适用于无服务器和微服务架构。消息在被处理和删除以前一直存储在队列上。每条消息仅可被一位用户处理一次。消息队列可被用于分离重量级处理、缓冲或批处理工做以及缓解高峰期工做负载。

如今经常使用的MQ组件有activeMQrabbitMQrocketMQzeroMQ 还有近年来火热的kafka,从某些场景来讲也是MQ,固然kafka的功能更增强大,虽然不一样的MQ都有本身的特色和优点,可是,无论是哪一种MQ,都有MQ自己自带的一些特色。

9.2 MQ主要特性

特性 说明
推送或拉取传送 拉取是指不断查询队列以获取新消息。推送是指系统在有可用消息时通知用户 (也称为发布/订阅消息收发)。您还可使用长轮询让拉取等待指定的时间,以便新消息在完成以前到达。
定时或延迟传送 支持为消息设置特定的传送时间。若是须要为全部消息设置相同延迟,能够设置一个延迟队列。
至少一次传送 消息队列能够存储多个消息副本以实现冗余和高可用性,并在发生通讯故障或错误的状况下从新发送消息,以确保它们至少通过一次传送。
确切一次传送 在不允许重复的状况下,FIFO (先进先出) 消息队列会经过自动筛选重复来确保每一个消息均精确地传输了一次 (且只有一次)。
FIFO (先进先出) 队列 在这些队列中,首先接受处理的是最先的 (或第一个) 条目,有时称为“队首”。
消息优先级 一般状况下,您能够为消息分配优先级,以肯定要在队列中添加该消息的位置,从而确保优先级较高的消息位于队列前端并获得优先处理。

9.3 MQ应用示例

来源:MQ(消息队列)常见的应用场景解析

咱们的实际场景大概是一个基于微服务架构的电商系统,分为用户微服务、商品微服务、订单微服务、促销微服务等。

基于微服务模式开发的系统,MQ的使用场景更多。这里咱们就列举一下常见的应用示例。

1. 注册后的初始化

注册后咱们可能须要作不少初始化的操做,如:

  • 调用邮件服务器发送邮件、调用促销服务赠送优惠劵、下发用户数据到客户关系系统等。
  • 那么这时候咱们将这些操做去监听MQ,当用户注册成功事后,经过MQ通知其余业务进行操做。确保注册用户的性能。

2. 后台发布商品

后台发布商品的时候:

  • 商品数据须要从数据库中转换成搜索引擎数据(基于elasticsearch
  • 那么咱们应该将商品写入数据库后,再写入到MQ,而后经过监听MQ来生成elasticsearch对应的数据。

3.支付超时取消

用户下单后,24小时未支付,须要取消订单。

  • 之前咱们多是定时任务循环查询,而后取消订单。
  • 实际上,我更推荐相似延迟MQ的方式,避免了不少无效的数据库查询,将一个MQ设置为24小时后才让消费者消费掉,这样很大程度上能减轻服务器压力。

4. 支付完成后通知

  • 支付完成后,须要及时的通知子系统(进销存系统发货,用户服务积分,发送短信)进行下一步操做。
  • 可是,支付回调咱们都是须要保证高性能的,因此,应该直接修改数据库状态,存入MQ,让MQ通知子系统作其余非实时的业务操做。这样能保证核心业务的高效及时。

免责声明

逛国外社区看到这篇,以为挺简洁明了的。

只是以为好玩,就按其大纲,重写总结一下,有说错的地方多担待。

意思就是写得略粗糙,别喷我。。。

❤️ 看完三件事

若是你以为这篇内容对你挺有启发,我想邀请你帮我三个小忙:

  1. 点赞,让更多的人也能看到这篇内容(收藏不点赞,都是耍流氓 -_-)
  2. 关注公众号「前端劝退师」,不按期分享原创知识。
  3. 也看看其它文章

也能够来个人GitHub博客里拿全部文章的源文件:

前端劝退指南github.com/roger-hiro/…

相关文章
相关标签/搜索