RPC(Remote Procedure Call)即远程过程调用,容许一台计算机调用另外一台计算机上的程序获得结果,而代码中不须要作额外的编程,就像在本地调用同样。如今互联网应用的量级愈来愈大,单台计算机的能力有限,须要借助可扩展的计算机集群来完成,分布式的应用能够借助RPC来完成机器之间的调用。git
在RPC框架中主要有三个角色:Provider、Consumer和Registry。以下图所示: github
节点角色说明:
* Server: 暴露服务的服务提供方。
* Client: 调用远程服务的服务消费方。
* Registry: 服务注册与发现的注册中心。web
RPC基本流程图:
redis
一次完整的RPC调用流程(同步调用,异步另说)以下:
1)服务消费方(client)调用以本地调用方式调用服务;
2)client stub接收到调用后负责将方法、参数等组装成可以进行网络传输的消息体;
3)client stub找到服务地址,并将消息发送到服务端;
4)server stub收到消息后进行解码;
5)server stub根据解码结果调用本地的服务;
6)本地服务执行并将结果返回给server stub;
7)server stub将返回结果打包成消息并发送至消费方;
8)client stub接收到消息,并进行解码;
9)服务消费方获得最终结果。spring
RPC框架的目标就是要2~8这些步骤都封装起来,让用户对这些细节透明。编程
服务提供者启动后主动向注册中心注册机器ip、port以及提供的服务列表;
服务消费者启动时向注册中心获取服务提供方地址列表,可实现软负载均衡和Failover;缓存
一、动态代理
生成 client stub和server stub须要用到 Java 动态代理技术 ,咱们可使用JDK原生的动态代理机制,可使用一些开源字节码工具框架 如:CgLib、Javassist等。服务器
二、序列化
为了能在网络上传输和接收 Java对象,咱们须要对它进行 序列化和反序列化操做。
* 序列化:将Java对象转换成byte[]的过程,也就是编码的过程;
* 反序列化:将byte[]转换成Java对象的过程;网络
可使用Java原生的序列化机制,可是效率很是低,推荐使用一些开源的、成熟的序列化技术,例如:protobuf、Thrift、hessian、Kryo、Msgpack架构
关于序列化工具性能比较能够参考:jvm-serializers
三、NIO
当前不少RPC框架都直接基于netty这一IO通讯框架,好比阿里巴巴的HSF、dubbo,Hadoop Avro,推荐使用Netty 做为底层通讯框架。
四、服务注册中心
可选技术:
* Redis
* Zookeeper
* Consul
* Etcd
负载均衡:
Nginx:高性能、高并发的web服务器;功能包括负载均衡、反向代理、静态内容缓存、访问控制;工做在应用层
LVS: Linux virtual server,基于集群技术和Linux操做系统实现一个高性能、高可用的服务器;工做在网络层
cache:
memcache、redis等
rpc框架:
grpc、dubbo、brpc
dubbo是阿里开源的Java语言开发的高性能RPC框架,在阿里系的诸多架构中,都使用了dubbo + spring boot
消息队列:
kafka、rabbitMQ、rocketMQ、QSP
消息队列的应用场景:异步处理、应用解耦、流量削锋和消息通信
实时数据平台:
storm、akka
离线数据平台:
hadoop、spark
PS: apark、akka、kafka都是scala语言写的,看到这个语言仍是很牛逼的
日志:
rsyslog、elk、flume