1、分布式基础理论
一、什么是分布式系统?
分布式系统是若干独立计算机的集合,这些计算机对于用户来讲就像单个相关系统。分布式系统(distributed system)是创建在网络之上的软件系统。
随着互联网的发展,网站应用的规模不断扩大,常规的垂直应用架构已没法应对,分布式服务架构以及流动计算架构势在必行,亟需一个治理系统确保架构有条不紊的演进。前端
二、发展演变程序员
1)、单一应用架构算法
当网站流量很小时,只需一个应用,将全部功能都部署在一块儿,以减小部署节点和成本。此时,用于简化增删改查工做量的数据访问框架(ORM)是关键。apache
适用于小型网站,小型管理系统,将全部功能都部署到一个功能里,简单易用。
缺点:性能扩展比较难;协同开发问题;不利于升级维护。网络
2)、垂直应用架构
当访问量逐渐增大,单一应用增长机器带来的加速度愈来愈小,将应用拆成互不相干的几个应用,以提高效率。此时,用于加速前端页面开发的Web框架(MVC)是关键。架构
经过切分业务来实现各个模块独立部署,下降了维护和部署的难度,团队各司其职更易管理,性能扩展也更方便,更有针对性。负载均衡
缺点: 公用模块没法重复利用,开发性的浪费
3)、分布式服务架构
当垂直应用愈来愈多,应用之间交互不可避免,将核心业务抽取出来,做为独立的服务,逐渐造成稳定的服务中心,使前端应用能更快速的响应多变的市场需求。此时,用于提升业务复用及整合的分布式服务框架(RPC)是关键。框架
4)、流动计算架构运维
当服务愈来愈多,容量的评估,小服务资源的浪费等问题逐渐显现,此时需增长一个调度中心基于访问压力实时管理集群容量,提升集群利用率。此时,用于提升机器利用率的资源调度和治理中心(SOA)[ Service Oriented Architecture]是关键。分布式
三、RPC
RPC[Remote Procedure Call]是指远程过程调用,是一种进程间通讯方式,他是一种技术的思想,而不是规范。它容许程序调用另外一个地址空间(一般是共享网络的另外一台机器上)的过程或函数,而不用程序员显式编码这个远程调用的细节。即程序员不管是调用本地的仍是远程的函数,本质上编写的调用代码基本相同。
RPC基本原理
RPC两个核心模块:通信,序列化。
2、dubbo核心概念
一、简介
高性能Java RPC框架Apache Dubbo (incubating) |ˈdʌbəʊ| 是一款高性能、轻量级的开源Java RPC框架,它提供了三大核心能力:面向接口的远程方法调用,智能容错和负载均衡,以及服务自动注册和发现。
官网:http://dubbo.apache.org/
二、基本概念
服务提供者(Provider):暴露服务的服务提供方,服务提供者在启动时,向注册中心注册本身提供的服务。
服务消费者(Consumer): 调用远程服务的服务消费方,服务消费者在启动时,向注册中心订阅本身所需的服务,服务消费者,从提供者地址列表中,基于软负载均衡算法,选一台提供者进行调用,若是调用失败,再选另外一台调用。
注册中心(Registry):注册中心返回服务提供者地址列表给消费者,若是有变动,注册中心将基于长链接推送变动数据给消费者
监控中心(Monitor):服务消费者和提供者,在内存中累计调用次数和调用时间,定时每分钟发送一次统计数据到监控中心
调用关系说明:
服务容器负责启动,加载,运行服务提供者。
服务提供者在启动时,向注册中心注册本身提供的服务。
服务消费者在启动时,向注册中心订阅本身所需的服务。
注册中心返回服务提供者地址列表给消费者,若是有变动,注册中心将基于长链接推送变动数据给消费者。
服务消费者,从提供者地址列表中,基于软负载均衡算法,选一台提供者进行调用,若是调用失败,再选另外一台调用。
服务消费者和提供者,在内存中累计调用次数和调用时间,定时每分钟发送一次统计数据到监控中心。
三、dubbo特性
1)、面向接口代理的高性能RPC调用提供高性能的基于代理的远程调用能力,服务以接口为粒度,为开发者屏蔽远程调用底层细节2)、智能负载均衡内置多种负载均衡策略,智能感知下游节点健康情况,显著减小调用延迟,提升系统吞吐量。3)、服务自动注册与发现支持多种注册中心服务,服务实例上下线实时感知。4)、高度可扩展能力遵循微内核+插件的设计原则,全部核心能力如Protocol、Transport、Serialization被设计为扩展点,平等对待内置实现和第三方实现。5)、运行期流量调度内置条件、脚本等路由策略,经过配置不一样的路由规则,轻松实现灰度发布,同机房优先等功能。6)、可视化的服务治理与运维提供丰富服务治理、运维工具:随时查询服务元数据、服务健康状态及调用统计,实时下发路由策略、调整配置参数。