spring data jpa 全面解析（实践 + 源码分析）

时间 2019-11-06

标签 spring data jpa 全面解析实践源码分析栏目 Spring 繁體版

原文原文链接

前言

本文将从示例、原理、应用3个方面介绍spring data jpa。java

如下分析基于spring boot 2.0 + spring 5.0.4版本源码mysql

概述

JPA是什么？

JPA (Java Persistence API) 是 Sun 官方提出的 Java 持久化规范。它为 Java 开发人员提供了一种对象/关联映射工具来管理 Java 应用中的关系数据。他的出现主要是为了简化现有的持久化开发工做和整合 ORM 技术，结束如今 Hibernate，TopLink，JDO 等 ORM 框架各自为营的局面。值得注意的是，JPA 是在充分吸取了现有 Hibernate，TopLink，JDO 等ORM框架的基础上发展而来的，具备易于使用，伸缩性强等优势。从目前的开发社区的反应上看，JPA 受到了极大的支持和赞赏，其中就包括了 Spring 与 EJB3.0 的开发团队。git

注意:JPA 是一套规范，不是一套产品，那么像 Hibernate，TopLink，JDO 他们是一套产品，若是说这些产品实现了这个 JPA 规范，那么咱们就能够叫他们为 JPA 的实现产品。

spring data jpa

Spring Data JPA 是 Spring 基于 ORM 框架、JPA 规范的基础上封装的一套 JPA 应用框架，底层使用了 Hibernate 的 JPA 技术实现，可以使开发者用极简的代码便可实现对数据的访问和操做。它提供了包括增删改查等在内的经常使用功能，且易于扩展！学习并使用 Spring Data JPA 能够极大提升开发效率！程序员

spring data jpa 让咱们解脱了 DAO 层的操做，基本上全部 CRUD 均可以依赖于它来实现

示例

配置

maven

<dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> </dependency> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-data-jpa</artifactId> </dependency>

为什么不指定版本号呢？
由于 spring boot 的 pom 依赖了 parent，部分 jar 包的版本已在 parent 中指定，故不建议显示指定正则表达式

<parent> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-parent</artifactId> <version>2.0.0.RELEASE</version> <relativePath/> <!-- lookup parent from repository --> </parent>

application.properties

spring.datasource.url=jdbc:mysql://*:*/test?useUnicode=true&characterEncoding=utf-8&serverTimezone=UTC&useSSL=true spring.datasource.username= spring.datasource.password= spring.datasource.driver-class-name=com.mysql.jdbc.Driver spring.jpa.properties.hibernate.hbm2ddl.auto=update spring.jpa.properties.hibernate.dialect=org.hibernate.dialect.MySQL5InnoDBDialect spring.jpa.show-sql=true

配置就这么简单，下面简单介绍下spring.jpa.properties.hibernate.hbm2ddl.auto有几种配置：算法

create：每次加载Hibernate时都会删除上一次生成的表（包括数据），而后从新生成新表，即便两次没有任何修改也会这样执行。适用于每次执行单测前清空数据库的场景。
create-drop：每次加载Hibernate时都会生成表，但当SessionFactory关闭时，所生成的表将自动删除。
update：最经常使用的属性值，第一次加载Hibernate时建立数据表（前提是须要先有数据库），之后加载Hibernate时不会删除上一次生成的表，会根据实体更新，只新增字段，不会删除字段（即便实体中已经删除）。
validate：每次加载Hibernate时都会验证数据表结构，只会和已经存在的数据表进行比较，根据model修改表结构，但不会建立新表。

不配置此项，表示禁用自动建表功能spring

Repository

创建 entitysql

@Entity @Data public class User { @Id @GeneratedValue private long id; @Column(nullable = false, unique = true) private String userName; @Column(nullable = false) private String password; @Column(nullable = false) private int age; }

声明 UserRepository接口，继承JpaRepository，默认支持简单的 CRUD 操做，很是方便数据库

public interface UserRepository extends JpaRepository<User, Long> { User findByUserName(String userName); }

单测

@Slf4j public class UserTest extends ApplicationTests { @Autowired private UserRepository userRepository; @Test @Transactional public void userTest() { User user = new User(); user.setUserName("wyk"); user.setAge(30); user.setPassword("aaabbb"); userRepository.save(user); User item = userRepository.findByUserName("wyk"); log.info(JsonUtils.toJson(item)); } }

这里标记@Transactional，开启事务功能是为了单元测试的时候不形成垃圾数据缓存

源代码下载：请戳这里

原理

不少人会有疑问，直接声明接口不须要具体实现就能完成数据库的操做？下面就简单介绍下 spring data jpa 的实现原理。

如何工做

对单测进行debug，能够发现userRepository被注入了一个动态代理，被代理的类是JpaRepository的一个实现SimpleJpaRespositry

继续往下debug,在进到findByUserName方法的时候，发现被上文提到的JdkDynamicAopProxy捕获，而后通过一系列的方法拦截，最终进到QueryExecutorMethodInterceptor.doInvoke中。这个拦截器主要作的事情就是判断方法类型，而后执行对应的操做.
咱们的findByUserName属于自定义查询，因而就进入了查询策略对应的execute方法。在执行execute时，会先选取对应的JpaQueryExecution，调用AbtractJpaQuery.getExecution()

protected JpaQueryExecution getExecution() {
  if (method.isStreamQuery()) { return new StreamExecution(); } else if (method.isProcedureQuery()) { return new ProcedureExecution(); } else if (method.isCollectionQuery()) { return new CollectionExecution(); } else if (method.isSliceQuery()) { return new SlicedExecution(method.getParameters()); } else if (method.isPageQuery()) { return new PagedExecution(method.getParameters()); } else if (method.isModifyingQuery()) { return method.getClearAutomatically() ? new ModifyingExecution(method, em) : new ModifyingExecution(method, null); } else { return new SingleEntityExecution(); } }

如上述代码所示，根据method变量实例化时的查询设置方式，实例化不一样的JpaQueryExecution子类实例去运行。咱们的findByUserName最终落入了SingleEntityExecution —— 返回单个实例的 Execution。继续跟踪execute方法，发现底层使用了 hibernate 的 CriteriaQueryImpl 完成了sql的拼装，这里就不作赘述了。

再来看看这类的method。在 spring-data-jpa 中，JpaQueryMethod就是Repository接口中带有@Query注解方法的所有信息，包括注解，类名，实参等的存储类，因此Repository接口有多少个@Query注解方法，就会包含多少个JpaQueryMethod实例被加入监听序列。实际运行时，一个RepositoryQuery实例持有一个JpaQueryMethod实例，JpaQueryMethod又持有一个Method实例。

再来看看RepositoryQuery，在QueryExecutorMethodInterceptor中维护了一个Map<Method, RepositoryQuery> queries。RepositoryQuery的直接抽象子类是AbstractJpaQuery，能够看到，一个RepositoryQuery实例持有一个JpaQueryMethod实例，JpaQueryMethod又持有一个Method实例，因此RepositoryQuery实例的用途很明显，一个RepositoryQuery表明了Repository接口中的一个方法，根据方法头上注解不一样的形态，将每一个Repository接口中的方法分别映射成相对应的RepositoryQuery实例。

下面咱们就来看看spring-data-jpa对RepositoryQuery实例的具体分类：
1.SimpleJpaQuery
方法头上@Query注解的nativeQuery属性缺省值为false，也就是使用JPQL，此时会建立SimpleJpaQuery实例，并经过两个StringQuery类实例分别持有query jpql语句和根据query jpql计算拼接出来的countQuery jpql语句；

2.NativeJpaQuery
方法头上@Query注解的nativeQuery属性若是显式的设置为nativeQuery=true，也就是使用原生SQL，此时就会建立NativeJpaQuery实例；

3.PartTreeJpaQuery
方法头上未进行@Query注解，将使用spring-data-jpa首创的方法名识别的方式进行sql语句拼接，此时在spring-data-jpa内部就会建立一个PartTreeJpaQuery实例；

4.NamedQuery
使用javax.persistence.NamedQuery注解访问数据库的形式，此时在spring-data-jpa内部就会根据此注解选择建立一个NamedQuery实例；

5.StoredProcedureJpaQuery
顾名思义，在Repository接口的方法头上使用org.springframework.data.jpa.repository.query.Procedure注解，也就是调用存储过程的方式访问数据库，此时在spring-data-jpa内部就会根据@Procedure注解而选择建立一个StoredProcedureJpaQuery实例。

那么问题来了，sql 拼接的时候怎么知道是根据userName进行查询呢？是取自方法名中的 byUsername 仍是方法参数 userName 呢？ spring 具体是在何时知道查询参数的呢？

数据如何注入

spring 在启动的时候会实例化一个 Repositories，它会去扫描全部的 class，而后找出由咱们定义的、继承自org.springframework.data.repository.Repositor的接口，而后遍历这些接口，针对每一个接口依次建立以下几个实例:

SimpleJpaRespositry —— 用来进行默认的 DAO 操做，是全部 Repository 的默认实现
JpaRepositoryFactoryBean —— 装配 bean，装载了动态代理 Proxy，会以对应的 DAO 的 beanName 为 key 注册到DefaultListableBeanFactory中，在须要被注入的时候从这个 bean 中取出对应的动态代理 Proxy 注入给 DAO
JdkDynamicAopProxy —— 动态代理对应的InvocationHandler，负责拦截 DAO 接口的全部的方法调用，而后作相应处理，好比findByUsername被调用的时候会先通过这个类的 invoke 方法

在JpaRepositoryFactoryBean.getRepository()方法被调用的过程当中，仍是在实例化QueryExecutorMethodInterceptor这个拦截器的时候，spring 会去为咱们的方法建立一个PartTreeJpaQuery，在它的构造方法中同时会实例化一个PartTree对象。PartTree定义了一系列的正则表达式，所有用于截取方法名，经过方法名来分解查询的条件，排序方式，查询结果等等，这个分解的步骤是在进程启动时加载 Bean 的过程当中进行的，当执行查询的时候直接取方法对应的PartTree用来进行 sql 的拼装，而后进行 DB 的查询，返回结果。

到此为止，咱们整个JpaRepository接口相关的链路就算走通啦，简单的总结以下：
spring 会在启动的时候扫描全部继承自 Repository 接口的 DAO 接口，而后为其实例化一个动态代理，同时根据它的方法名、参数等为其装配一系列DB操做组件，在须要注入的时候为对应的接口注入这个动态代理，在 DAO 方法被调用的时会走这个动态代理，而后通过一系列的方法拦截路由到最终的 DB 操做执行器JpaQueryExecution，而后拼装 sql，执行相关操做，返回结果。

应用

基本查询

基本查询分为两种，一种是 spring data 默认已经实现（只要继承JpaRepository），一种是根据查询的方法来自动解析成 SQL。

预先生成

public interface UserRepository extends JpaRepository<User, Long> { } @Test public void testBaseQuery() throws Exception { User user=new User(); userRepository.findAll(); userRepository.findOne(1l); userRepository.save(user); userRepository.delete(user); userRepository.count(); userRepository.exists(1l); // ... }

自定义简单查询

自定义的简单查询就是根据方法名来自动生成SQL，主要的语法是findXXBy,readAXXBy,queryXXBy,countXXBy, getXXBy后面跟属性名称，举几个例子：

User findByUserName(String userName); User findByUserNameOrEmail(String username, String email); Long deleteById(Long id); Long countByUserName(String userName); List<User> findByEmailLike(String email); User findByUserNameIgnoreCase(String userName); List<User> findByUserNameOrderByEmailDesc(String email);

具体的关键字，使用方法和生产成 SQL 以下表所示

Keyword	Sample	JPQL snippet
And	findByLastnameAndFirstname	… where x.lastname = ?1 and x.firstname = ?2
Or	findByLastnameOrFirstname	… where x.lastname = ?1 or x.firstname = ?2
Is,Equals	findByFirstnameIs,findByFirstnameEquals	… where x.firstname = ?1
Between	findByStartDateBetween	… where x.startDate between ?1 and ?2
LessThan	findByAgeLessThan	… where x.age < ?1
LessThanEqual	findByAgeLessThanEqual	… where x.age ⇐ ?1
GreaterThan	findByAgeGreaterThan	… where x.age > ?1
GreaterThanEqual	findByAgeGreaterThanEqual	… where x.age >= ?1
After	findByStartDateAfter	… where x.startDate > ?1
Before	findByStartDateBefore	… where x.startDate < ?1
IsNull	findByAgeIsNull	… where x.age is null
IsNotNull,NotNull	findByAge(Is)NotNull	… where x.age not null
Like	findByFirstnameLike	… where x.firstname like ?1
NotLike	findByFirstnameNotLike	… where x.firstname not like ?1
StartingWith	findByFirstnameStartingWith	… where x.firstname like ?1 (parameter bound with appended %)
EndingWith	findByFirstnameEndingWith	… where x.firstname like ?1 (parameter bound with prepended %)
Containing	findByFirstnameContaining	… where x.firstname like ?1 (parameter bound wrapped in %)
OrderBy	findByAgeOrderByLastnameDesc	… where x.age = ?1 order by x.lastname desc
Not	findByLastnameNot	… where x.lastname <> ?1
In	findByAgeIn(Collection<age> ages)</age>	… where x.age in ?1
NotIn	findByAgeNotIn(Collection<age> age)</age>	… where x.age not in ?1
TRUE	findByActiveTrue()	… where x.active = true
FALSE	findByActiveFalse()	… where x.active = false
IgnoreCase	findByFirstnameIgnoreCase	… where UPPER(x.firstame) = UPPER(?1)

复杂查询

在实际的开发中咱们须要用到分页、删选、连表等查询的时候就须要特殊的方法或者自定义 SQL

分页查询

分页查询在实际使用中很是广泛了，spring data jpa已经帮咱们实现了分页的功能，在查询的方法中，须要传入参数Pageable
，当查询中有多个参数的时候Pageable建议作为最后一个参数传入。Pageable是 spring 封装的分页实现类，使用的时候须要传入页数、每页条数和排序规则

Page<User> findALL(Pageable pageable); Page<User> findByUserName(String userName,Pageable pageable);

@Test
public void testPageQuery() throws Exception { int page=1,size=10; Sort sort = new Sort(Direction.DESC, "id"); Pageable pageable = new PageRequest(page, size, sort); userRepository.findALL(pageable); userRepository.findByUserName("testName", pageable); }

有时候咱们只须要查询前N个元素，或者支取前一个实体。

User findFirstByOrderByLastnameAsc(); User findTopByOrderByAgeDesc(); Page<User> queryFirst10ByLastname(String lastname, Pageable pageable); List<User> findFirst10ByLastname(String lastname, Sort sort); List<User> findTop10ByLastname(String lastname, Pageable pageable);

自定义SQL查询

其实 Spring data 大部分的 SQL 均可以根据方法名定义的方式来实现，可是因为某些缘由咱们想使用自定义的 SQL 来查询，spring data 也是完美支持的；在 SQL 的查询方法上面使用 @Query 注解，如涉及到删除和修改在须要加上 @Modifying 。也能够根据须要添加 @Transactional 对事物的支持，查询超时的设置等

@Modifying @Query("update User u set u.userName = ?1 where c.id = ?2") int modifyByIdAndUserId(String userName, Long id); @Transactional @Modifying @Query("delete from User where id = ?1") void deleteByUserId(Long id); @Transactional(timeout = 10) @Query("select u from User u where u.emailAddress = ?1") User findByEmailAddress(String emailAddress);

多表查询

多表查询在 spring data jpa 中有两种实现方式，第一种是利用 hibernate 的级联查询来实现，第二种是建立一个结果集的接口来接收连表查询后的结果，这里介绍第二种方式。

首先须要定义一个结果集的接口类。

public interface HotelSummary { City getCity(); String getName(); Double getAverageRating(); default Integer getAverageRatingRounded() { return getAverageRating() == null ? null : (int) Math.round(getAverageRating()); } }

查询的方法返回类型设置为新建立的接口

@Query("select h.city as city, h.name as name, avg(r.rating) as averageRating from Hotel h left outer join h.reviews r where h.city = ?1 group by h") Page<HotelSummary> findByCity(City city, Pageable pageable); @Query("select h.name as name, avg(r.rating) as averageRating from Hotel h left outer join h.reviews r group by h") Page<HotelSummary> findByCity(Pageable pageable);

Page<HotelSummary> hotels = this.hotelRepository.findByCity(new PageRequest(0, 10, Direction.ASC, "name")); for(HotelSummary summay:hotels){ System.out.println("Name" +summay.getName()); }

在运行中 Spring 会给接口（HotelSummary）自动生产一个代理类来接收返回的结果，代码会使用 getXX 的形式来获取

和 mybatis 的比较

spring data jpa 底层采用 hibernate 作为 ORM 框架，因此 spring data jpa 和 mybatis 的比较其实就是 hibernate 和 mybatis 的比较。下面从几个方面来对比下二者

基本概念

从基本概念和框架目标上看，两个框架差异仍是很大的。hibernate 是一个自动化更强、更高级的框架，毕竟在java代码层面上，省去了绝大部分 sql 编写，取而代之的是用面向对象的方式操做关系型数据库的数据。而 MyBatis 则是一个可以灵活编写 sql 语句，并将 sql 的入参和查询结果映射成 POJOs 的一个持久层框架。因此，从表面上看，hibernate 能方便、自动化更强，而 MyBatis 在 Sql 语句编写方面则更灵活自由。

性能

正如上面介绍的， Hibernate 比 MyBatis 抽象封装的程度更高，理论上单个语句之心的性能会低一点（全部的框架都是同样，排除算法上的差别，越是底层，执行效率越高）。

但 Hibernate 会设置缓存，对于重复查询有必定的优化，并且从编码效率来讲，Hibernate 的编码效果确定是会高一点的。因此，从总体的角度来看性能的话，其实二者不能彻底说谁胜谁劣。

ORM

Hibernate 是完备的 ORM 框架，是符合 JPA 规范的， MyBatis 没有按照JPA那套规范实现。目前 Spring 以及 Spring Boot 官方都没有针对 MyBatis 有具体的支持，但对 Hibernate 的集成一直是有的。但这并非说 mybatis 和 spring 没法集成，MyBatis 官方社区自身也是有对 Spring，Spring boot 集成作支持的，因此在技术上，二者都不存在问题。

总结

总结下 mybatis 的优势：

简单易学
灵活，MyBatis不会对应用程序或者数据库的现有设计强加任何影响。注解或者使用 SQL 写在 XML 里，便于统一管理和优化。经过 SQL 基本上能够实现咱们不使用数据访问框架能够实现的全部功能，或许更多。
解除 SQL 与程序代码的耦合，SQL 和代码的分离，提升了可维护性。
提供映射标签，支持对象与数据库的 ORM 字段关系映射。
提供对象关系映射标签，支持对象关系组建维护。
提供XML标签，支持编写动态SQL。

hibernate 的优势：
JPA 的宗旨是为 POJO 提供持久化标准规范，实现使用的 Hibernate，Hibernate 是一个全自动的持久层框架，而且提供了面向对象的 SQL 支持，不须要编写复杂的 SQL 语句，直接操做 Java 对象便可，从而大大下降了代码量，让即便不懂 SQL 的开发人员，也使程序员更加专一于业务逻辑的实现。对于关联查询，也仅仅是使用一些注解便可完成一些复杂的 SQL功能。

最后再作一个简单的总结：

若是能有很好的数据库规范的话，使用这两个哪一个都不会差
若是有能力而且特别想掌控 SQL，那就选 MyBaits，不然就依赖 JPA 的魔力来快速完成业务开发
我的认为二者最本质的不一样点，hibernate 的理念是面向对象，mybatis 的理念是面向过程，相似于 JAVA 和 PYTHON。固然，用hibernate也能够写出面向关系代码和系统，但却得不到面向关系的各类好处，最大的即是编写 sql 的灵活性，同时也失去面向对象意义和好处——一句话，不三不四。那么，面向对象和关系型模型有什么不一样，体如今哪里呢？实际上二者要面对的领域和要解决的问题是根本不一样的：面向对象致力于解决计算机逻辑问题，而关系模型致力于解决数据的高效存取问题。咱们不妨对比一下面向对象的概念原则和关系型数据库的不一样之处：面向对象考虑的是对象的整个生命周期包括在对象的建立、持久化、状态的改变和行为等，对象的持久化只是对象的一种状态，而面向关系型数据库的概念则更关注数据的高效存储和读取；面向对象更强调对象状态的封装性，对象封装本身的状态（或数据）不容许外部对象随意修改，只暴露一些合法的行为方法供外部对象调用；而关系型数据库则是开放的，能够供用户随意读取和修改关系，并能够和其余表任意的关联（只要sql正确容许的状况下）；面向对象试图为动态的世界建模，他要描述的是世界的过程和规律，进而适应发展和变化，面向对象老是在变化中处理各类各样的变化。而关系型模型为静态世界建模，它经过数据快照记录了世界在某一时候的状态，它是静态的。从上面二者基本概念和思想的对比来看，能够得出结论hibernate和MyBatis两个框架的侧重点彻底不一样。因此咱们就两个框架选择上，就须要根据不一样的项目需求选择不一样的框架。在框架的使用中，也要考虑考虑框架的优点和劣势，扬长避短，发挥出框架的最大效用，才能真正的提升项目研发效率、完成项目的目标。但相反，若是使用Spring Data JPA和hibernate等ORM的框架而没有以面向对象思想和方法去分析和设计系统，而是抱怨框架不能灵活操做sql查询数据，那就是想让狗去帮你拿耗子了。