Hibernate缓存策略详解

时间 2019-11-07

标签 hibernate 缓存策略详解栏目 Hibernate 繁體版

原文原文链接

Hibernate缓存策略html

1. 数据缓存

1.1. 概述

缓存是数据库数据临时容器，它包含了库表数据的临时拷贝，位于数据库与数据访问层之间。linux

ORM 在进行数据读取时，会根据其缓存管理策略，首先在内存中查询，若是在内存中发现所需数据（缓存命中），则直接以此数据错位查询结果加以利用，从而避免了数据库调用的性能开销。数据库

缓存的介质通常是内存，因此读写速度很快。但若是缓存中存放的数据量很是大时，也会用硬盘做为缓存介质。缓存的实现不只仅要考虑存储的介质，还要考虑到管理缓存的并发访问和缓存数据的生命周期。缓存

1.2. 缓存范围

缓存的范围决定了缓存的生命周期以及能够被谁访问。缓存的范围分为三级。并发

1) 事物级缓存(Transaction Layer Cache )分布式

缓存只能被当前事务访问。缓存的生命周期依赖于事务的生命周期，当事务结束时，缓存也就结束生命周期。在此范围下，缓存的介质是内存。事务能够是数据库事务或者应用事务，每一个事务都有独自的缓存，缓存内的数据一般采用相互关联的的对象形式。性能

2) 应用级/进程级缓存(Application/ProcessLayer Cache)spa

缓存被进程内的全部事务共享。这些事务有多是并发访问缓存，所以必须对缓存采起必要的事务隔离机制。缓存的生命周期依赖于进程的生命周期，进程结束时，缓存也就结束了生命周期。进程范围的缓存可能会存放大量的数据，因此存放的介质能够是内存或硬盘。缓存内的数据既能够是相互关联的对象形式也能够是对象的松散数据形式。hibernate

3) 集群/分布式缓存(Cluster Layer Cache)插件

在集群环境中，缓存被一个机器或者多个机器的进程共享。缓存中的数据被复制到集群环境中的每一个进程节点，进程间经过远程通讯来保证缓存中的数据的一致性，缓存中的数据一般采用对象的松散数据形式。

对大多数应用来讲，应该慎重地考虑是否须要使用集群范围的缓存，由于访问的速度不必定会比直接访问数据库数据的速度快多少。

持久化层能够提供多种范围的缓存。若是在事务范围的缓存中没有查到相应的数据，还能够到进程范围或集群范围的缓存内查询，若是仍是没有查到，那么只有到数据库中查询。事务范围的缓存是持久化层的第一级缓存，一般它是必需的；进程范围或集群范围的缓存是持久化层的第二级缓存，一般是可选的。

1.3. 缓存的并发访问策略

当多个并发的事务同时访问持久化层的缓存的相同数据时，会引发并发问题，必须采用必要的事务隔离措施。

1) Read-only

只读。对于历来不会修改的数据，如参考数据，可使用这种并发访问策略。

2) Nonstrict-read-write

非严格读写。若是程序对并发访问下的数据同步要求不是很是严格，且数据更新操做频率较低（几个小时以上），能够采用这种并发访问策略，得到较好的性能。

3) Read-write

严格读写。提供了Read Committed事务隔离级别。仅仅在非集群的环境中适用。对于常常被读但不多修改的数据，能够采用这种隔离类型，由于它能够防止脏读这类的并发问题。

4) Transactional

事务。仅仅在托管环境中适用。它提供了Repeatable Read事务隔离级别。对于常常被读但不多修改的数据，能够采用这种隔离类型，由于它能够防止脏读和不可重复读这类的并发问题。

事务型并发访问策略是事务隔离级别最高，只读型的隔离级别最低。事务隔离级别越高，并发性能就越低。

2. Hibernate缓存

2.1. 概述

Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存由hibernate管理的，通常状况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存能够进行配置和更改，而且能够动态加载和卸载。 Hibernate还为查询结果提供了一个查询缓存，它依赖于第二级缓存。

2.2. 一级缓存和二级缓存比较

	第一级缓存	第二级缓存
存放数据的形式	相互关联的持久化对象	对象的散装数据
缓存的范围	事务范围，每一个事务都有单独的第一级缓存	进程范围或集群范围，缓存被同一个进程或集群范围内的全部事务共享
并发访问策略	因为每一个事务都拥有单独的第一级缓存，不会出现并发问题，无需提供并发访问策略	因为多个事务会同时访问第二级缓存中相同数据，所以必须提供适当的并发访问策略，来保证特定的事务隔离级别
数据过时策略	没有提供数据过时策略。处于一级缓存中的对象永远不会过时，除非应用程序显式清空缓存或者清除特定的对象	必须提供数据过时策略，如基于内存的缓存中的对象的最大数目，容许对象处于缓存中的最长时间，以及容许对象处于缓存中的最长空闲时间
物理存储介质	内存	内存和硬盘。对象的散装数据首先存放在基于内在的缓存中，当内存中对象的数目达到数据过时策略中指定上限时，就会把其他的对象写入基于硬盘的缓存中。
缓存的软件实现	在Hibernate的Session的实现中包含了缓存的实现	由第三方提供，Hibernate仅提供了缓存适配器(CacheProvider)。用于把特定的缓存插件集成到Hibernate中。
启用缓存的方式	只要应用程序经过Session接口来执行保存、更新、删除、加载和查询数据库数据的操做，Hibernate就会启用第一级缓存，把数据库中的数据以对象的形式拷贝到缓存中，对于批量更新和批量删除操做，若是不但愿启用第一级缓存，能够绕过Hibernate API，直接经过JDBC　API来执行指操做。	用户能够在单个类或类的单个集合的粒度上配置第二级缓存。若是类的实例被常常读但不多被修改，就能够考虑使用第二级缓存。只有为某个类或集合配置了第二级缓存，Hibernate在运行时才会把它的实例加入到第二级缓存中。
用户管理缓存的方式	第一级缓存的物理介质为内存，因为内存容量有限，必须经过恰当的检索策略和检索方式来限制加载对象的数目。Session的evit()方法能够显式清空缓存中特定对象，但这种方法不值得推荐。	第二级缓存的物理介质能够是内存和硬盘，所以第二级缓存能够存放大量的数据，数据过时策略的maxElementsInMemory属性值能够控制内存中的对象数目。管理第二级缓存主要包括两个方面：选择须要使用第二级缓存的持久类，设置合适的并发访问策略：选择缓存适配器，设置合适的数据过时策略。

2.3. 二级缓存应用的范围

1) 适合存放到二级缓存中的数据

不多被修改的数据

不是很重要的数据，容许出现偶尔并发的数据

不会被并发访问的数据

参考数据

2) 不适合存放到二级缓存的数据

常常被修改的数据

财务数据，绝对不容许出现并发

与其余应用共享的数据。

2.4. Hibernate的二级缓存策略的通常过程

1) 条件查询的时候，老是发出一条select * from table_name where …. （选择全部字段）这样的SQL语句查询数据库，一次得到全部的数据对象。

2) 把得到的全部数据对象根据ID放入到第二级缓存中。

3) 当Hibernate根据ID访问数据对象的时候，首先从Session一级缓存中查；查不到，若是配置了二级缓存，那么从二级缓存中查；查不到，再查询数据库，把结果按照ID放入到缓存。

4) 删除、更新、增长数据的时候，同时更新缓存。

Hibernate的二级缓存策略，是针对于ID查询的缓存策略，对于条件查询则毫无做用。为此，Hibernate提供了针对条件查询的Query缓存。

2.5. Hibernate的Query缓存策略的过程

1) Hibernate首先根据这些信息组成一个QueryKey，Query Key包括条件查询的请求通常信息：SQL, SQL须要的参数，记录范围（起始位置rowStart，最大记录个数maxRows)，等。

2) Hibernate根据这个Query Key到Query缓存中查找对应的结果列表。若是存在，那么返回这个结果列表；若是不存在，查询数据库，获取结果列表，把整个结果列表根据Query Key放入到Query缓存中。

3) Query Key中的SQL涉及到一些表名，若是这些表的任何数据发生修改、删除、增长等操做，这些相关的Query Key都要从缓存中清空。