你应该知道的 RPC 原理

时间 2019-12-05

标签应该知道 rpc 原理栏目微服务繁體版

原文原文链接

在校期间你们都写过很多程序，好比写个hello world服务类，而后本地调用下，以下所示。这些程序的特色是服务消费方和服务提供方是本地调用关系。java

而一旦踏入公司尤为是大型互联网公司就会发现，公司的系统都由成千上万大大小小的服务组成，各服务部署在不一样的机器上，由不一样的团队负责。这时就会遇到两个问题：1）要搭建一个新服务，免不了须要依赖他人的服务，而如今他人的服务都在远端，怎么调用？2）其它团队要使用咱们的服务，咱们的服务该怎么发布以便他人调用？下文咱们将对这两个问题展开探讨。git

1github

2面试

3apache

public interface HelloWorldService {网络

String sayHello(String msg);数据结构

}并发

1负载均衡

2框架

public class HelloWorldServiceImpl implements HelloWorldService {

@Override

public String sayHello(String msg) {

String result = "hello world " + msg;

System.out.println(result);

return result;

}

public class Test {

public static void main(String[] args) {

HelloWorldService helloWorldService = new HelloWorldServiceImpl();

helloWorldService.sayHello("test");

}

1 如何调用他人的远程服务？

因为各服务部署在不一样机器，服务间的调用免不了网络通讯过程，服务消费方每调用一个服务都要写一坨网络通讯相关的代码，不只复杂并且极易出错。

若是有一种方式能让咱们像调用本地服务同样调用远程服务，而让调用者对网络通讯这些细节透明，那么将大大提升生产力，好比服务消费方在执行helloWorldService.sayHello(“test”)时，实质上调用的是远端的服务。这种方式其实就是RPC（Remote Procedure Call Protocol），在各大互联网公司中被普遍使用，如阿里巴巴的hsf、dubbo（开源）、Facebook的thrift（开源）、Google grpc（开源）、Twitter的finagle等。

要让网络通讯细节对使用者透明，咱们天然须要对通讯细节进行封装，咱们先看下一个RPC调用的流程：

1）服务消费方（client）调用以本地调用方式调用服务；
2）client stub接收到调用后负责将方法、参数等组装成可以进行网络传输的消息体；
3）client stub找到服务地址，并将消息发送到服务端；
4）server stub收到消息后进行解码；
5）server stub根据解码结果调用本地的服务；
6）本地服务执行并将结果返回给server stub；
7）server stub将返回结果打包成消息并发送至消费方；
8）client stub接收到消息，并进行解码；
9）服务消费方获得最终结果。

RPC的目标就是要2~8这些步骤都封装起来，让用户对这些细节透明。

1.1 怎么作到透明化远程服务调用？

怎么封装通讯细节才能让用户像以本地调用方式调用远程服务呢？对java来讲就是使用代理！java代理有两种方式：1） jdk 动态代理；2）字节码生成。尽管字节码生成方式实现的代理更为强大和高效，但代码不易维护，大部分公司实现RPC框架时仍是选择动态代理方式。

下面简单介绍下动态代理怎么实现咱们的需求。咱们须要实现RPCProxyClient代理类，代理类的invoke方法中封装了与远端服务通讯的细节，消费方首先从RPCProxyClient得到服务提供方的接口，当执行helloWorldService.sayHello(“test”)方法时就会调用invoke方法。

public class RPCProxyClient implements java.lang.reflect.InvocationHandler{

private Object obj;

public RPCProxyClient(Object obj){

this.obj=obj;

}

/**

* 获得被代理对象;

public static Object getProxy(Object obj){

return java.lang.reflect.Proxy.newProxyInstance(obj.getClass().getClassLoader(),

obj.getClass().getInterfaces(), new RPCProxyClient(obj));

}

/**

* 调用此方法执行

public Object invoke(Object proxy, Method method, Object[] args)

throws Throwable {

//结果参数;

Object result = new Object();

// ...执行通讯相关逻辑

// ...

return result;

}

public class Test {

public static void main(String[] args) {

HelloWorldService helloWorldService = (HelloWorldService)RPCProxyClient.getProxy(HelloWorldService.class);

helloWorldService.sayHello("test");

}

1.2 怎么对消息进行编码和解码？

1.2.1 肯定消息数据结构

上节讲了invoke里须要封装通讯细节，而通讯的第一步就是要肯定客户端和服务端相互通讯的消息结构。客户端的请求消息结构通常须要包括如下内容：

1）接口名称

在咱们的例子里接口名是“HelloWorldService”，若是不传，服务端就不知道调用哪一个接口了；

2）方法名

一个接口内可能有不少方法，若是不传方法名服务端也就不知道调用哪一个方法；

3）参数类型&参数值

参数类型有不少，好比有bool、int、long、double、string、map、list，甚至如struct（class）；

以及相应的参数值；

4）超时时间

5）requestID，标识惟一请求id，在下面一节会详细描述requestID的用处。

同理服务端返回的消息结构通常包括如下内容。

1）返回值

2）状态code

3）requestID

1.2.2 序列化

一旦肯定了消息的数据结构后，下一步就是要考虑序列化与反序列化了。

什么是序列化？序列化就是将数据结构或对象转换成二进制串的过程，也就是编码的过程。

什么是反序列化？将在序列化过程当中所生成的二进制串转换成数据结构或者对象的过程。

为何须要序列化？转换为二进制串后才好进行网络传输嘛！为何须要反序列化？将二进制转换为对象才好进行后续处理！

现现在序列化的方案愈来愈多，每种序列化方案都有优势和缺点，它们在设计之初有本身独特的应用场景，那到底选择哪一种呢？从RPC的角度上看，主要看三点：1）通用性，好比是否能支持Map等复杂的数据结构；2）性能，包括时间复杂度和空间复杂度，因为RPC框架将会被公司几乎全部服务使用，若是序列化上能节约一点时间，对整个公司的收益都将很是可观，同理若是序列化上能节约一点内存，网络带宽也能省下很多；3）可扩展性，对互联网公司而言，业务变化快，若是序列化协议具备良好的可扩展性，支持自动增长新的业务字段，删除老的字段，而不影响老的服务，这将大大提供系统的健壮性。

目前国内各大互联网公司普遍使用hessian、protobuf、thrift、avro等成熟的序列化解决方案来搭建RPC框架，这些都是久经考验的解决方案。

1.3 通讯

消息数据结构被序列化为二进制串后，下一步就要进行网络通讯了。目前有两种IO通讯模型：1）BIO；2）NIO。通常RPC框架须要支持这两种IO模型，原理可参考：《一个故事讲清楚 NIO》。

如何实现RPC的IO通讯框架？1）使用java nio方式自研，这种方式较为复杂，并且颇有可能出现隐藏bug，见过一些互联网公司使用这种方式；2）基于mina，mina在早几年比较火热，不过这些年版本更新缓慢；3）基于netty，如今不少RPC框架都直接基于netty这一IO通讯框架，好比阿里巴巴的HSF、dubbo，Twitter的finagle等。

1.4 消息里为何要带有requestID？

若是使用netty的话，通常会用channel.writeAndFlush()方法来发送消息二进制串，这个方法调用后对于整个远程调用(从发出请求到接收到结果)来讲是一个异步的，即对于当前线程来讲，将请求发送出来后，线程就能够日后执行了，至于服务端的结果，是服务端处理完成后，再以消息的形式发送给客户端的。因而这里出现如下两个问题：

1）怎么让当前线程“暂停”，等结果回来后，再向后执行？

2）若是有多个线程同时进行远程方法调用，这时创建在client server之间的socket链接上会有不少双方发送的消息传递，先后顺序也多是随机的，server处理完结果后，将结果消息发送给client，client收到不少消息，怎么知道哪一个消息结果是原先哪一个线程调用的？

以下图所示，线程A和线程B同时向client socket发送请求requestA和requestB，socket前后将requestB和requestA发送至server，而server可能将responseA先返回，尽管requestA请求到达时间更晚。咱们须要一种机制保证responseA丢给ThreadA，responseB丢给ThreadB。

怎么解决呢？

1）client线程每次经过socket调用一次远程接口前，生成一个惟一的ID，即requestID（requestID必需保证在一个Socket链接里面是惟一的），通常经常使用AtomicLong从0开始累计数字生成惟一ID；

2）将处理结果的回调对象callback，存放到全局ConcurrentHashMap里面put(requestID, callback)；

3）当线程调用channel.writeAndFlush()发送消息后，紧接着执行callback的get()方法试图获取远程返回的结果。在get()内部，则使用synchronized获取回调对象callback的锁，再先检测是否已经获取到结果，若是没有，而后调用callback的wait()方法，释放callback上的锁，让当前线程处于等待状态。

4）服务端接收到请求并处理后，将response结果（此结果中包含了前面的requestID）发送给客户端，客户端socket链接上专门监听消息的线程收到消息，分析结果，取到requestID，再从前面的ConcurrentHashMap里面get(requestID)，从而找到callback对象，再用synchronized获取callback上的锁，将方法调用结果设置到callback对象里，再调用callback.notifyAll()唤醒前面处于等待状态的线程。

public Object get() {

synchronized (this) { // 旋锁

while (!isDone) { // 是否有结果了

wait(); //没结果是释放锁，让当前线程处于等待状态

}

private void setDone(Response res) {

this.res = res;

isDone = true;

synchronized (this) { //获取锁，由于前面wait()已经释放了callback的锁了

notifyAll(); // 唤醒处于等待的线程

}

2 如何发布本身的服务？

如何让别人使用咱们的服务呢？有同窗说很简单嘛，告诉使用者服务的IP以及端口就能够了啊。确实是这样，这里问题的关键在因而自动告知仍是人肉告知。

人肉告知的方式：若是你发现你的服务一台机器不够，要再添加一台，这个时候就要告诉调用者我如今有两个ip了，大家要轮询调用来实现负载均衡；调用者咬咬牙改了，结果某天一台机器挂了，调用者发现服务有一半不可用，他又只能手动修改代码来删除挂掉那台机器的ip。现实生产环境固然不会使用人肉方式。

有没有一种方法能实现自动告知，即机器的增添、剔除对调用方透明，调用者再也不须要写死服务提供方地址？固然能够，现现在zookeeper被普遍用于实现服务自动注册与发现功能！

简单来说，zookeeper能够充当一个服务注册表（Service Registry），让多个服务提供者造成一个集群，让服务消费者经过服务注册表获取具体的服务访问地址（ip+端口）去访问具体的服务提供者。以下图所示：

具体来讲，zookeeper就是个分布式文件系统，每当一个服务提供者部署后都要将本身的服务注册到zookeeper的某一路径上: /{service}/{version}/{ip:port}, 好比咱们的HelloWorldService部署到两台机器，那么zookeeper上就会建立两条目录：分别为/HelloWorldService/1.0.0/100.19.20.01:16888 /HelloWorldService/1.0.0/100.19.20.02:16888。

zookeeper提供了“心跳检测”功能，它会定时向各个服务提供者发送一个请求（实际上创建的是一个 socket 长链接），若是长期没有响应，服务中心就认为该服务提供者已经“挂了”，并将其剔除，好比100.19.20.02这台机器若是宕机了，那么zookeeper上的路径就会只剩/HelloWorldService/1.0.0/100.19.20.01:16888。

服务消费者会去监听相应路径（/HelloWorldService/1.0.0），一旦路径上的数据有任务变化（增长或减小），zookeeper都会通知服务消费方服务提供者地址列表已经发生改变，从而进行更新。

更为重要的是zookeeper 与生俱来的容错容灾能力（好比leader选举），能够确保服务注册表的高可用性。

3 小结

RPC几乎是每个从学校进入互联网公司的同窗都要首先学习的框架，以前面试过一个在大型互联网公司工做过两年的同窗，对RPC仍是停留在使用层面，这是不该该的。本文也仅是对RPC的一个比较粗糙的描述，但愿对你们有所帮助，错误之处也请指出修正。

4 一些开源的RPC框架

https://github.com/alibaba/dubbo

http://thrift.apache.org/?cm_mc_uid=87762817217214314008006&cm_mc_sid_50200000=1444181090