上一期从线程安全的角度聊了聊系统设计要注意的事情,此次换个角度继续聊聊系统设计
此次主题围绕系统设计:有状态、无状态html
惯例,先看栗子node
网站登陆校验,很普通的一个功能
对于这个功能咱们要如何实现?web
先分析一下登陆校验是个啥意思
举个栗子,好比咱们在登录页输入用户名密码,登陆了社交网站
这时候想去看本身的新鲜事,却告诉我请先输入用户名密码进行验证。。
这时候想去吐槽下这个2B体验,发个新鲜事,点完发布按钮时,又弹出框说请输入用户名密码进行验证。。。这时候脑子里上千个草泥马奔腾而过shell
这样的产品能够说拜拜了安全
对咱们的用户来讲,登陆操做其实完成一次就够了,后续的操做服务应该可以自动识别出是这个合法用户
所以,咱们就须要对用户的状态进行记录,后续直接在后台里自动帮用户进行校验服务器
OK,需求分析完了,那该怎么实现呢?cookie
in the old time
咱们直接经过session的方式,单机时代很方便,也够用了 session
用户登陆后咱们经过session来保存,简单高效,done负载均衡
随着用户量和访问量的增大,单机彷佛不够用了,加一台机器吧
这时候也引入了负载均衡服务,对应用服务器上的session也增长了同步的逻辑 分布式
比之前稍稍复杂了些,但也还好。可是若是用户量不断增长,访问量不断变多
继续加应用服务器,加一台,两台。。十台。。。?
这个session同步机制怎么保证依然快速有效?
这么大量的数据同步,带宽资源的消耗很可观啊
另外,N台应用服务器都有相同的session副本,这是对内存资源的极大糟蹋啊
那么有没有更加优雅的方案呢?
这里举一个方案
采用cookie + session服务器的方案
1.用户在登陆页完成登陆操做后,服务器会生成一个登陆session信息,保存起来,设置个失效时间,并设置到用户的cookie里
2.用户后续的每次请求里会带着这个cookie信息,服务端会对这个cookie信息进行校验,经过了就认为是合法用户,执行请求操做
这个方案的好处比较明显
应用服务器变成无状态了,对session的统一管理由专门的服务来处理
引出了今天的主题:有状态和无状态
什么是有状态和无状态
这个话题结合系统设计,拿应用服务器来讲会容易理解
像刚才介绍的,应用服务器里持有用户的session,这时应用服务器是有状态的
由于保存了用户会话这个上下文信息,后续的用户请求都会须要访问这个session信息
多个应用服务器之间是副本的关系,须要保持session数据的同步
无状态的应用服务器,像刚才把session挪出应用服务器,由专门的服务进行管理
此时应用服务器不保存上下文信息,只负责对用户的每次请求提交数据进行处理而后返回处理结果
无状态应用服务器之间是对等的关系,无依赖,请求到哪一个服务器,处理结果都同样的
有状态的服务,会有比较明显的缺点,服务间数据须要同步,成为副本关系,逻辑复杂也浪费资源
相对来讲,无状态的服务,就会简单多了
能够来作个比较
对于高可用服务的构建要求来讲,快速failover以及快速扩容是很是重要的
服务有状态,服务当机就可能会存在数据丢失
关键是快速扩容,有状态服务会有冷启动的问题,还须要先加载数据才能对外提供服务,太麻烦了
因此你们在进行系统设计时,时刻要有这个意识,咱们的应用服务器,要设计成无状态
不保存任何上下文信息
拓展学习: CAP理论
其实有状态服务也有其自身的好处,数据状态在服务中保存,无需额外的调用,低延迟
不须要额外的存储,服务自己已经存了
关于构建可伸缩的有状态服务,能够看下这篇文章的介绍
http://www.infoq.com/cn/news/2015/12/scaling-stateful-services
若是要构建有状态的服务,那就有必要了解CAP理论了
先看下维基百科对CAP的介绍:
In theoretical computer science, the CAP theorem also known as Brewer’s theorem, states that it is impossible for a distributed computer system to simultaneously provide all three of the following guarantees
Consistency (all nodes see the same data at the same time)
Availability (a guarantee that every request receives a response about whether it succeeded or failed)
Partition tolerance (the system continues to operate despite arbitrary partitioning due to network failures)
大名鼎鼎的CAP理论的意思是说,一个分布式系统没法同时知足三个条件
一致性、可用性、分区容忍性
一致性,数据要保证一致,保证准确性
可用性,咱们的服务要保证24小时可用
分区容忍性,访问量太大了,要扩容,体现为系统的可伸缩性了,部署多个实例或副本
可是呢,扩容了,保证了可用性,数据一致性怎么保证?
副本这么多,同步机制太难作好了。有个经典有趣的问题:拜占庭将军问题,感谢能够去了解
互联网公司通常会选择保证AP,保证高可用,可是一致性呢,该怎么办
CAP理论并不彻底适用于指导实际的工程开发,因此对于一致性,通常会这样去考虑
强一致性,必须保证一致性,任意时刻都能读到最新值。这个,呵呵
弱一致性,写入新值后,在副本上可能读出来,也可能读不出来
最终一致性,在某个时间后,可以读到最新的值
CAP理论相关的知识涉及面比较广,你们感兴趣能够多看看,这里就先介绍到这里
左耳朵耗子有篇文章,对分布式系统的理论进行了些介绍,感兴趣能够看看
http://coolshell.cn/articles/10910.html
最后回到今天的主题,咱们在系统设计上,遵循的原则仍是简单为主
经过简单的设计来知足咱们的业务需求
如何简单?非特殊状况,都设计成无状态的吧
最后再补充个题外话: 开头所讲的栗子里提到使用cookie,这个可能会存在安全的问题 好比XSS,跨站脚本攻击。可能会致使cookie信息被窃取,因此须要对XSS进行安全防御了 web安全又是一大块知识啊,感兴趣能够本身深刻学习 --------------------- 做者:zhoumingp 来源:CSDN 原文:https://blog.csdn.net/zhoumingp/article/details/50457203 版权声明:本文为博主原创文章,转载请附上博文连接!