咱们来看看解决问题的方案:前端
一、第一个问题便是负载均衡的问题,通常有5种解决方案:java
一、http重定向。HTTP重定向就是应用层的请求转发。用户的请求其实已经到了HTTP重定向负载均衡服务器,服务器根据算法要求用户重定向,用户收到重定向请求后,再次请求真正的集群mysql
优势:简单。nginx
缺点:性能较差。web
二、DNS域名解析负载均衡。DNS域名解析负载均衡就是在用户请求DNS服务器,获取域名对应的IP地址时,DNS服务器直接给出负载均衡后的服务器IP。redis
优势:交给DNS,不用咱们去维护负载均衡服务器。算法
缺点:当一个应用服务器挂了,不能及时通知DNS,并且DNS负载均衡的控制权在域名服务商那里,网站没法作更多的改善和更强大的管理。spring
三、反向代理服务器。在用户的请求到达反向代理服务器时(已经到达网站机房),由反向代理服务器根据算法转发到具体的服务器。经常使用的apache,nginx均可以充当反向代理服务器。sql
优势:部署简单。数据库
缺点:代理服务器可能成为性能的瓶颈,特别是一次上传大文件。
四、IP层负载均衡。在请求到达负载均衡器后,负载均衡器经过修改请求的目的IP地址,从而实现请求的转发,作到负载均衡。
优势:性能更好。
缺点:负载均衡器的宽带成为瓶颈。
五、数据链路层负载均衡。在请求到达负载均衡器后,负载均衡器经过修改请求的mac地址,从而作到负载均衡,与IP负载均衡不同的是,当请求访问完服务器以后,直接返回客户。而无需再通过负载均衡器。
二、第二个问题便是集群调度算法问题,常见的调度算法有10种。
一、rr 轮询调度算法。顾名思义,轮询分发请求。
优势:实现简单
缺点:不考虑每台服务器的处理能力
二、wrr 加权调度算法。咱们给每一个服务器设置权值weight,负载均衡调度器根据权值调度服务器,服务器被调用的次数跟权值成正比。
优势:考虑了服务器处理能力的不一样
三、sh 原地址散列:提取用户IP,根据散列函数得出一个key,再根据静态映射表,查处对应的value,即目标服务器IP。过目标机器超负荷,则返回空。
四、dh 目标地址散列:同上,只是如今提取的是目标地址的IP来作哈希。
优势:以上两种算法的都能实现同一个用户访问同一个服务器。
五、lc 最少链接。优先把请求转发给链接数少的服务器。
优势:使得集群中各个服务器的负载更加均匀。
六、wlc 加权最少链接。在lc的基础上,为每台服务器加上权值。算法为:(活动链接数*256+非活动链接数)÷权重 ,计算出来的值小的服务器优先被选择。
优势:能够根据服务器的能力分配请求。
七、sed 最短时间望延迟。其实sed跟wlc相似,区别是不考虑非活动链接数。算法为:(活动链接数+1)*256÷权重,一样计算出来的值小的服务器优先被选择。
八、nq 永不排队。改进的sed算法。咱们想一下什么状况下才能“永不排队”,那就是服务器的链接数为0的时候,那么假若有服务器链接数为0,均衡器直接把请求转发给它,无需通过sed的计算。
九、LBLC 基于局部性的最少链接。均衡器根据请求的目的IP地址,找出该IP地址最近被使用的服务器,把请求转发之,若该服务器超载,最采用最少链接数算法。
十、LBLCR 带复制的基于局部性的最少链接。均衡器根据请求的目的IP地址,找出该IP地址最近使用的“服务器组”,注意,并非具体某个服务器,而后采用最少链接数从该组中挑出具体的某台服务器出来,把请求转发之。若该服务器超载,那么根据最少链接数算法,在集群的非本服务器组的服务器中,找出一台服务器出来,加入本服务器组,而后把请求转发之。
三、第三个问题是集群模式问题,通常3种解决方案:
一、NAT:负载均衡器接收用户的请求,转发给具体服务器,服务器处理完请求返回给均衡器,均衡器再从新返回给用户。
二、DR:负载均衡器接收用户的请求,转发给具体服务器,服务器出来玩请求后直接返回给用户。须要系统支持IP Tunneling协议,难以跨平台。
三、TUN:同上,但无需IP Tunneling协议,跨平台性好,大部分系统均可以支持。
四、第四个问题是session问题,通常有4种解决方案:
一、Session Sticky。session sticky就是把同一个用户在某一个会话中的请求,都分配到固定的某一台服务器中,这样咱们就不须要解决跨服务器的session问题了,常见的算法有ip_hash法,即上面提到的两种散列算法。
优势:实现简单。
缺点:应用服务器重启则session消失。
二、Session Replication。session replication就是在集群中复制session,使得每一个服务器都保存有所有用户的session数据。
优势:减轻负载均衡服务器的压力,不须要要实现ip_hasp算法来转发请求。
缺点:复制时宽带开销大,访问量大的话session占用内存大且浪费。
三、Session数据集中存储:session数据集中存储就是利用数据库来存储session数据,实现了session和应用服务器的解耦。
优势:相比session replication的方案,集群间对于宽带和内存的压力减小了不少。
缺点:须要维护存储session的数据库。
四、Cookie Base:cookie base就是把session存在cookie中,有浏览器来告诉应用服务器个人session是什么,一样实现了session和应用服务器的解耦。
优势:实现简单,基本免维护。
缺点:cookie长度限制,安全性低,宽带消耗。
值得一提的是:
nginx目前支持的负载均衡算法有wrr、sh(支持一致性哈希)、fair(本人以为能够归结为lc)。但nginx做为均衡器的话,还能够一同做为静态资源服务器。
keepalived+ipvsadm比较强大,目前支持的算法有:rr、wrr、lc、wlc、lblc、sh、dh
keepalived支持集群模式有:NAT、DR、TUN
nginx自己并无提供session同步的解决方案,而apache则提供了session共享的支持。
好了,解决了以上的问题以后,系统的结构以下:
数据库作读库的话,经常对模糊查找力不从心,即便作了读写分离,这个问题还未能解决。以咱们所举的交易网站为例,发布的商品存储在数据库中,用户最常使用的功能就是查找商品,尤为是根据商品的标题来查找对应的商品。对于这种需求,通常咱们都是经过like功能来实现的,可是这种方式的代价很是大。此时咱们可使用搜索引擎的倒排索引来完成。
搜索引擎并不能替代数据库,他解决了某些场景下的“读”的问题,是否引入搜索引擎,须要综合考虑整个系统的需求。引入搜索引擎后的系统结构以下:
一、后台应用层和数据库层的缓存
值得一提的是:
缓存集群的调度算法不一样与上面提到的应用服务器和数据库。最好采用“一致性哈希算法”,这样才能提升命中率。这个就不展开讲了,有兴趣的能够查阅相关资料。
咱们的网站演进到如今,交易、商品、用户的数据都还在同一个数据库中。尽管采起了增长缓存,读写分离的方式,但随着数据库的压力继续增长,数据库的瓶颈愈来愈突出,此时,咱们能够有数据垂直拆分和水平拆分两种选择。
7.一、数据垂直拆分
垂直拆分的意思是把数据库中不一样的业务数据拆分道不一样的数据库中,结合如今的例子,就是把交易、商品、用户的数据分开。
垂直拆分后的结构以下:
7.二、数据水平拆分
数据水平拆分就是把同一个表中的数据拆分到两个甚至多个数据库中。产生数据水平拆分的缘由是某个业务的数据量或者更新量到达了单个数据库的瓶颈,这时就能够把这个表拆分到两个或更多个数据库中。
数据水平拆分后的结构:
8.一、拆分应用
随着业务的发展,业务愈来愈多,应用愈来愈大。咱们须要考虑如何避免让应用愈来愈臃肿。这就须要把应用拆开,从一个应用变为俩个甚至更多。仍是以咱们上面的例子,咱们能够把用户、商品、交易拆分开。变成“用户、商品”和“用户,交易”两个子系统。
拆分后的结构:
8.二、走服务化的道路
为了解决上面拆分应用后所出现的问题,咱们把公共的服务拆分出来,造成一种服务化的模式,简称SOA。
采用服务化以后的系统结构:
以上的演变过程只是一个例子,并不适合全部的网站,实际中网站演进过程与自身业务和不一样遇到的问题有密切的关系,没有固定的模式。只有认真的分析和不断地探究,才能发现适合本身网站的架构。