GraphQL java工程化实践

时间 2019-11-10

标签 graphql java 工程实践栏目 Java 繁體版

原文原文链接

由于本身写过基于react的前端应用，所以一看到GraphQL就被深深吸引，真是直击痛点啊！
服务端开发一直是基于java, Spring的，所以开始研究如何在现有工程框架下加入graphql的支持。
本文属于随笔性质，学到哪里，用到哪里，就写到哪里，观点为我的理解，仅供参考。javascript

GraphQL基本概念

Schema: 指一个特定GraphQL类型系统的定义，也指具体的包含类型系统定义的文本文件。在类型定义中，schema {...} 这样的代码块定义的是入口类型，入口类型有三种，即查询，变动和订阅。值得说明的是，查询，变动和订阅也都是普通的类型而已，和其它对象类型语法上没有任何区别，只不过它们做为入口类型被定义在schema代码块中。
查询(query)：定义为入口的对象类型；和变动、订阅语法上并没有不一样，不过语义上对应的是读操做。
变动(mutation): 定义和语法同上，但语义上对应增/删/改操做。
订阅(subscription): 定义和语法同上，语义上对应的是一个订阅操做以及随后服务器对客户端的0~N次主动推送操做。
内省（introspection）: 能够经过特殊的graphql查询获取到整个类型系统的详细定义。这可能带来数据模型过分暴露的问题，之后会专门说明。
类型(type): 没什么好说，就是对象类型，和标量类型相对应。
标量(scalar): 非对象的简单数据类型，好比内置的String, Int, ID等。能够本身定义新的标量类型，只要为它编写序列化/反序列化方法便可，具体在graphql-java中对应的类是Coercing。
字段(field): 对象类型的成员，能够是对象类型或者标量类型。和java类里的field不一样的是，GraphQL的field都是能够有参数的，所以有参数的field也能够理解成java中有特定类型返回值的方法。
接口(interface): 和java里的接口差很少，定义类型的公共字段，java实现中能够直接对应写一个interface。有点麻烦的是在每一个interface的实现类中都必须重复书写公共字段。
联合(union): 和接口相似，可是不要求任何公共字段。为了方即可以在java实现中使用无方法的interface实现。
片断(fragment): 这是个查询时的概念，和schema定义无关，用于预约义类型上的若干个字段组合，后面的查询语句中能够反复引用，可避免重复书写这些字段组合。
内联片断(inline fragment)：片断还只是个简化查询的无关紧要的东西，但内联片断则更重要，对于返回interface或union类型的字段，须要使用内联片断来根据结果的实际类型获取不一样的字段。
别名(alias): 在查询中可为特定字段的查询增长别名，用来在返回的结果中加以区分，好比一次查询了两个特定用户，由于类型相同，字段也相同，若是不用别名，则没法在结果中区分彼此。
类型扩展(extend): 在schema中，可使用extend给任意类型（包括interface/union）增长字段；这看似自找麻烦的机制实际上有很大用处，能够把高权限角色的特定字段使用extend写在另外的schema文件中，运行时可合并解析，不一样角色的用户使用不一样的schema。这样能够经过加法来控制类型系统的可见性，避免内省机制过分暴露类型系统。
DataLoader: 用于批量查询，见后文介绍。
Relay: Facebook的另外一个框架，应该是基于GraphQL的，解决一些更高层的实际应用问题，好比通用的分页机制等。

graphql-java特定术语

DataFetcher: 数据获取器，即用以获取Field实际值的对象。
Data Class: 数据类，这是graphql-java-tools中的概念，对应schema中的同名对象类型。前端
- 能够在数据类上按照约定格式编写DataFetcher方法用于获取简单字段值（好比无需另外查询数据库的字段）。
- 我在工程实践中直接使用数据库实体类做为数据类。
GraphQLResolver: 这是graphql-java-tools中的接口，带有一个数据类的类型参数。java
- 对该数据类定义部分或全部字段值的获取方法，须要基于约定命名方法。
- 注意Resolver中的DataFetcher方法的优先级高于DataClass中的方法。
- 我在工程实践中直接使用Dao类做为对应实体类的GraphQLResolver。
ExecutionInput: graphql-java中用来包装一个完整查询输入的类，包括：node
- query - 查询字符串;
- operationName: 操做名; 可选；可用于在查询中的多个操做中仅选择特定名称的予以执行。
- variables: 变量; 可选；一个Map，用于替换查询字符串中形如'$value'的变量。
- context - 上下文; 可选；任意Object类型，会被传递给DataFetcher；可用于传递当前登陆用户等。
- root - 根对象; 可选；任意Object类型，会被传递给DataFetcher，语义上是被查询的根对象。
ExecutionStrategy(执行策略): 定义查询的具体执行策略。react
- 好比是否异步执行，多个子查询是依次执行，仍是用线程池并发执行等。
Instrumentation(拦截器): 比较像Servlet容器中的Filter，在查询执行先后各有一次执行机会。git
- 可用于对输入和结果进行额外处理；
- 支持链式执行；
- 须要指出的是DataLoader使用拦截器与核心系统耦合。
GraphqlFieldVisibility: 能够编程控制schema中各个字段的可见性。github
- 和extend对应，至关于用减法来控制类型系统的可见性。

技术选型

github上graphql-java名下的库很多，若是但愿了解各自简介的，能够看下awesome-graphql-java这个项目。
我本身评估了如下几个：spring

graphql-java: 这个是核心库，彻底符合Facebook的spec，能够直接解析schema文件，可是类型绑定须要使用RuntimeWiring来编程方式添加，用起来仍是比较麻烦的。
graphql-java-annotations: 这是数据驱动的流派，使用注解直接在java类型上标注GraphQL类型以及DataFetcher等，不用写schema文件。评估了一阵，我的感受很是麻烦，好比：对每一个字段都会建立新的DataFetcher实例来进行解析，十分低效；要编写不少类来访问不一样字段；过多的对象直接建立，难以托管到Spring容器；等等。所以个人结论是，此库并不适用于个人工程实践。
graphql-java-tools: 这是Schema驱动的流派，这个库使用Antlr本身重写了Schema解析器，使用GraphQLResolver实例和Data Class；基于方法名和参数的约定来定义DataFetching，使用起来很方便。这是我最终选定使用的库。不太爽的地方有两点：1) 当前版本基于graphql-java 7.0，迟滞于核心库 2) 使用Kotlin编写，我在MyEclipse里面没法正常设置断点进行跟踪调试……
graphql-java-servlet: GraphQL不像传统的REST，须要写一堆Controller，提供惟一的api接口便可，这个servlet就是帮你连这个都包办的，不过我没有用，本身基于SpringMVC写一个也很简单。

批量数据查询（解决N+1问题）

graphql-java提供了两种批量数据查询的方案:数据库

BatchedDataFetcher: 用起来挺简单的，普通的DataFetcher是给你一个ID让你返回一个对象，批量版是给你一个ID列表，让你返回对应的对象列表。不过这个不是Facebook推荐的方式，在新版本中会废弃掉。
DataLoader: 这个是Facebook官方推荐的方式，nodejs中的实现是基于js的异步机制延迟查询，把最近一个周期产生的多个查询集中执行（没详细了解，看文档大概如此），java版实现方式则略有不一样，下面详细介绍。

关于DataLoader

graphql-java的dataloader是基于java8中新增的CompletableFeature类（大概至关于javascript里面的Promise），实现异步延迟批量获取查询结果。编程

大概原理（我的理解）：

在DataFetcher方法中，并不直接返回实体类T，而是调用DataLoader.load()方法，返回一个CompletionStage<T>，这时并不当即进行实际查询，而是把这些异步阶段对象缓存起来。
在查询告一段落后（即可以当即获取的Field值都已取得，只剩下异步查询未完成了），graphql-java会经过DataLoaderDispatcherInstrumentation.dispatch方法通知全部当前注册的DataLoader去执行当前积压的全部异步阶段对象，具体就是会使用DataLoader对应的BatchLoader一次性查询一批对象。
这时候又有一批Field的值已经实际取得，继续按查询的请求向下层展开，若是有新的异步阶段对象产生，就继续步骤2，直到全部异步阶段对象都得到最终值。

工程实践中对其应用方式的考虑：
在graphql-java的官方教程中建议针对每请求建立新的DataLoader实例，查询请求结束则DataLoader实例们的生命周期结束。
这个实现方式比较简单，不用考虑缓存的更新问题，也不用考虑多个不一样请求的缓存对象是否可共用。
举个例子，张三和李四并发查询张三的信息，他们获取的"张三"用户实例的结构多是不一样的，这种状况这两个并发请求就不能共用缓存，而应该各自有独立的DataLoader实例。
不过在个人工程实践中，服务端内存中的数据实体类都是客观一致的，其结构可见性应在更上一层即DataFetcher甚至Schema级别中进行过滤。
所以个人想法是为每种实体类维护单例的DataLoader，和Dao对象一一对应。
这种状况下，就不能简单的使用DataLoader内部默认的简单内存缓存了，由于此缓存是不会自动定时清理的。
graphql-java是容许开发者提供本身的缓存实现的，下一步我会结合项目中使用的Spring缓存管理器来具体实现。

查询的缓存

graphql的查询自己是有必定语法结构的特殊文本，对该文本进行解析也是有性能开销的，所以graphql-java提供了缓存机制方便开发者把查询文本的解析后数据结构缓存起来。
如下代码引自官方教程，我准备结合咱们项目里的EhCache来实做一下。

Cache<String, PreparsedDocumentEntry> cache = Caffeine.newBuilder().maximumSize(10_000).build();
GraphQL graphQL = GraphQL.newGraphQL(StarWarsSchema.starWarsSchema)
        .preparsedDocumentProvider(cache::get)
        .build();

关于订阅的实现

工程实践中使用WebSocket实现订阅。
不管是graphql仍是graphql-java都未指定订阅的具体实现机制，但WebSocket是现代浏览器广泛支持的，高性能低限制的服务器推送机制。
SpringMVC支持WebSocket，同时支持在低版本浏览器中使用Sock.js做为兼容备选方案。
另外，graphql-java体验性支持的Defer数据获取也可基于WebSocket实现。

未完待续

参考资料

基于spring和graphql-java-tools的宠物店例程
 简单的TODO例程，使用relay的思路解决分页问题
 基于WebSocket实现GraphQL订阅