最近在看一些dbcp的相关内容,顺便作一下记录,省得本身给忘记了。javascript
1. 引入dbcp (选择1.4)html
Java代码 java

- <dependency>
- <groupId>com.alibaba.external</groupId>
- <artifactId>jakarta.commons.dbcp</artifactId>
- <version>1.4</version>
- </dependency>
2. dbcp的基本配置mysql
相关配置说明:算法
- initialSize :链接池启动时建立的初始化链接数量(默认值为0)
- maxActive :链接池中可同时链接的最大的链接数(默认值为8,调整为20,高峰单机器在20并发左右,本身根据应用场景定)
- maxIdle:链接池中最大的空闲的链接数,超过的空闲链接将被释放,若是设置为负数表示不限制(默认为8个,maxIdle不能设置过小,由于假如在高负载的状况下,链接的打开时间比关闭的时间快,会引发链接池中idle的个数 上升超过maxIdle,而形成频繁的链接销毁和建立,相似于jvm参数中的Xmx设置)
- minIdle:链接池中最小的空闲的链接数,低于这个数量会被建立新的链接(默认为0,调整为5,该参数越接近maxIdle,性能越好,由于链接的建立和销毁,都是须要消耗资源的;可是不能太大,由于在机器很空闲的时候,也会建立低于minidle个数的链接,相似于jvm参数中的Xmn设置)
- maxWait :最大等待时间,当没有可用链接时,链接池等待链接释放的最大时间,超过该时间限制会抛出异常,若是设置-1表示无限等待(默认为无限,调整为60000ms,避免因线程池不够用,而致使请求被无限制挂起)
- poolPreparedStatements:开启池的prepared(默认是false,未调整,通过测试,开启后的性能没有关闭的好。)
- maxOpenPreparedStatements:开启池的prepared 后的同时最大链接数(默认无限制,同上,未配置)
- minEvictableIdleTimeMillis :链接池中链接,在时间段内一直空闲, 被逐出链接池的时间
- (默认为30分钟,能够适当作调整,须要和后端服务端的策略配置相关)
- removeAbandonedTimeout :超过期间限制,回收没有用(废弃)的链接(默认为 300秒,调整为180)
- removeAbandoned :超过removeAbandonedTimeout时间后,是否进 行没用链接(废弃)的回收(默认为false,调整为true)
removeAbandoned参数解释:spring
- 若是开启了removeAbandoned,当getNumIdle() < 2) and (getNumActive() > getMaxActive() - 3)时被触发.
- 举例当maxActive=20, 活动链接为18,空闲链接为1时能够触发"removeAbandoned".可是活动链接只有在没有被使用的时间超 过"removeAbandonedTimeout"时才被回收
- logAbandoned: 标记当链接被回收时是否打印程序的stack traces日志(默认为false,未调整)
通常会是几种状况出现须要removeAbandoned: sql
- 代码未在finally释放connection , 不过咱们都用sqlmapClientTemplate,底层都有连接释放的过程
- 遇到数据库死锁。之前遇到事后端存储过程作了锁表操做,致使前台集群中链接池全都被block住,后续的业务处理由于拿不到连接全部都处理失败了。
一份优化过的配置:数据库
基本配置代码 apache

- <bean id="dataSource" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close">
- <property name="driverClassName" value="com.mysql.jdbc.Driver" />
- <property name="url" value="xxxx" />
- <property name="username"><value>xxxx</value></property>
- <property name="password"><value>xxxxx</value></property>
- <property name="maxActive"><value>20</value></property>
- <property name="initialSize"><value>1</value></property>
- <property name="maxWait"><value>60000</value></property>
- <property name="maxIdle"><value>20</value></property>
- <property name="minIdle"><value>3</value></property>
- <property name="removeAbandoned"><value>true</value></property>
- <property name="removeAbandonedTimeout"><value>180</value></property>
- <property name="connectionProperties"><value>clientEncoding=GBK</value></property>
- </bean>
2. dbcp的连接validate配置后端
- dbcp是采用了commons-pool作为其链接池管理,testOnBorrow,testOnReturn, testWhileIdle是pool是提供的几种校验机制,经过外部钩子的方式回调dbcp的相关数据库连接(validationQuery)校验
- dbcp相关外部钩子类:PoolableConnectionFactory,继承于common-pool PoolableObjectFactory
- dbcp经过GenericObjectPool这一入口,进行链接池的borrow,return处理
- testOnBorrow : 顾明思义,就是在进行borrowObject进行处理时,对拿到的connection进行validateObject校验
- testOnReturn : 顾明思义,就是在进行returnObject对返回的connection进行validateObject校验,我的以为对数据库链接池的管理意义不大
- testWhileIdle : 关注的重点,GenericObjectPool中针对pool管理,起了一个Evict的TimerTask定时线程进行控制(可经过设置参数timeBetweenEvictionRunsMillis>0),定时对线程池中的连接进行validateObject校验,对无效的连接进行关闭后,会调用ensureMinIdle,适当创建连接保证最小的minIdle链接数。
- timeBetweenEvictionRunsMillis,设置的Evict线程的时间,单位ms,大于0才会开启evict检查线程
- validateQuery, 表明检查的sql
- validateQueryTimeout, 表明在执行检查时,经过statement设置,statement.setQueryTimeout(validationQueryTimeout)
- numTestsPerEvictionRun,表明每次检查连接的数量,建议设置和maxActive同样大,这样每次能够有效检查全部的连接.
Validate配置代码

- <property name="testWhileIdle"><value>true</value></property> <!-- 打开检查,用异步线程evict进行检查 -->
- <property name="testOnBorrow"><value>false</value></property>
- <property name="testOnReturn"><value>false</value></property>
- <property name="validationQuery"><value>select sysdate from dual</value></property>
- <property name="validationQueryTimeout"><value>1</value></property>
- <property name="timeBetweenEvictionRunsMillis"><value>30000</value></property>
- <property name="numTestsPerEvictionRun"><value>20</value></property>
相关配置需求:
- 目前网站的应用大部分的瓶颈仍是在I/O这一块,大部分的I/O仍是在数据库的这一层面上,每个请求可能会调用10来次SQL查询,若是不走事务,一个请求会重复获取连接,若是每次获取连接都进行validateObject,性能开销不是很能接受,能够假定一次SQL操做消毫0.5~1ms(通常走了网络请求基本就这数)
- 网站异常数据库重启,网络异常断开的频率是很是低的,通常也就在数据库升级,演习维护时才会进行,并且通常也是选在晚上,访问量相对比较低的请求,并且通常会有人员值班关注,因此异步的validateObject是能够接受,但一个前提须要确保能保证在一个合理的时间段内,数据库能完成自动重联。
从代码层面简单介绍下dbcp的validate实现:
1. common-pools提供的PoolableObjectFactory,针对pool池的管理操做接口
Java代码

- public interface PoolableObjectFactory {
-
- Object makeObject() throws Exception;
-
- void destroyObject(Object obj) throws Exception;
-
- boolean validateObject(Object obj);
-
- void activateObject(Object obj) throws Exception;
-
- void passivateObject(Object obj) throws Exception;
- }
2. dbcp实现的pool从池管理操做
这里贴了一个相关validate代码,具体类可见:PoolableConnectionFactory.validateConnection()
Java代码

- public class PoolableConnectionFactory implements PoolableObjectFactory {
-
- ......
- public boolean validateObject(Object obj) { //验证validateObject
- if(obj instanceof Connection) {
- try {
- validateConnection((Connection) obj);
- return true;
- } catch(Exception e) {
- return false;
- }
- } else {
- return false;
- }
- }
- public void validateConnection(Connection conn) throws SQLException {
- String query = _validationQuery;
- if(conn.isClosed()) {
- throw new SQLException("validateConnection: connection closed");
- }
- if(null != query) {
- Statement stmt = null;
- ResultSet rset = null;
- try {
- stmt = conn.createStatement();
- if (_validationQueryTimeout > 0) {
- stmt.setQueryTimeout(_validationQueryTimeout);
- }
- rset = stmt.executeQuery(query);
- if(!rset.next()) {
- throw new SQLException("validationQuery didn't return a row");
- }
- } finally {
- if (rset != null) {
- try {
- rset.close();
- } catch(Exception t) {
- // ignored
- }
- }
- if (stmt != null) {
- try {
- stmt.close();
- } catch(Exception t) {
- // ignored
- }
- }
- }
- }
- }
-
- ....
-
- }
3. pool池的evict调用代码:GenericObjectPool (apache commons pool version 1.5.4)
Java代码

- protected synchronized void startEvictor(long delay) { //启动Evictor为TimerTask
- if(null != _evictor) {
- EvictionTimer.cancel(_evictor);
- _evictor = null;
- }
- if(delay > 0) {
- _evictor = new Evictor();
- EvictionTimer.schedule(_evictor, delay, delay);
- }
- }
-
- for (int i=0,m=getNumTests();i<m;i++) {
- final ObjectTimestampPair pair;
- .......
- boolean removeObject = false;
- // 空闲连接处理
- final long idleTimeMilis = System.currentTimeMillis() - pair.tstamp;
- if ((getMinEvictableIdleTimeMillis() > 0) &&
- (idleTimeMilis > getMinEvictableIdleTimeMillis())) {
- removeObject = true;
- } else if ((getSoftMinEvictableIdleTimeMillis() > 0) &&
- (idleTimeMilis > getSoftMinEvictableIdleTimeMillis()) &&
- ((getNumIdle() + 1)> getMinIdle())) {
- removeObject = true;
- }
- // testWhileIdle sql 检查处理
- if(getTestWhileIdle() && !removeObject) {
- boolean active = false;
- try {
- _factory.activateObject(pair.value);
- active = true;
- } catch(Exception e) {
- removeObject=true;
- }
- if(active) {
- if(!_factory.validateObject(pair.value)) {
- removeObject=true;
- } else {
- try {
- _factory.passivateObject(pair.value);
- } catch(Exception e) {
- removeObject=true;
- }
- }
- }
- }
- // 真正关闭
- if (removeObject) {
- try {
- _factory.destroyObject(pair.value);
- } catch(Exception e) {
- // ignored
- }
- }
- ........
注意: 目前dbcp的pool的实现是使用了公用的apache common pools进行扩展处理,因此和原生的链接池处理,代码看上去有点别扭,感受自动重连这块异常处理不怎么好,我也就只重点关注了这部分代码而已
.
3. dbcp的连接自动重链相关测试
相关场景:
- 数据库意外重启后,原先的数据库链接池能自动废弃老的无用的连接,创建新的数据库连接
- 网络异常中断后,原先的创建的tcp连接,应该能进行自动切换
测试需求1步骤
- 创建一testCase代码
- 配置mysql数据库
- 循环执行在SQL查询过程
- 异常重启mysql数据库
测试需求2步骤
- 创建一testCase代码
- 配置mysql数据库
- 循环执行在SQL查询过程
- 经过iptables禁用网络连接
/sbin/iptables -A INPUT -s 10.16.2.69 -j REJECT
/sbin/iptables -A FORWARD -p tcp -s 10.16.2.69 --dport 3306 -m state --state NEW,ESTABLISHED -j DROP
5. iptables -F 清空规则,恢复连接通道。
测试需求问题记录
分别测试了两种配置,有validateObject的配置和没有validateObject的相关配置。
1. 没有validate配置
问题一: 异常重启mysql数据库后,竟然也能够自动恢复连接,sql查询正常
跟踪了一下代码,发现这么一个问题:
- 在数据库关闭的时候,client中pool经过borrowObject获取一个异常连接返回给client
- client在使用具体的异常连接进行sql调用出错了,抛了异常
- 在finally,调用connection.close(),本意是应该调用pool经过returnObject返回到的池中,但在跟踪代码时,未见调用GenericObjectPool的returnObject
- 继续查,发如今dbcp在中PoolingDataSource(实现DataSource接口)调用PoolableConnection(dbcp pool相关的delegate操做)进行相应关闭时,会检查_conn.isClosed(),针对DataSource若是isClosed返回为true的则不调用returnObject,直接丢弃了连接
解释:
- 正由于在获取异常连接后,由于作了_conn.isClosed()判断,因此异常连接并无返回到链接池中,因此到数据库重启恢复后,每次都是调用pool从新构造一个新的connection,因此后面就正常了
- _conn.isClosed()是否保险,从jdk的api描述中: A connection is closed if the method close has been called on it or if certain fatal errors have occurred. 里面提供两种状况,一种就是被调用了closed方法,另外一种就是出现一些异常也说的比较含糊。
问题二:validateObject调用时,dbcp设置的validationQueryTimeout竟然没效果
看了mysql statement代码实现,找到了答案。
mysql com.mysql.jdbc.statemen 部分代码
timeout时间处理:
Java代码

- timeoutTask = new CancelTask();
- //经过TimerTask启动必定时任务
- Connection.getCancelTimer().schedule(timeoutTask, this.timeoutInMillis);
对应的CancelTask的代码:
Java代码

- class CancelTask extends TimerTask {
-
- long connectionId = 0;
-
- CancelTask() throws SQLException {
- connectionId = connection.getIO().getThreadId();
- }
-
- public void run() {
-
- Thread cancelThread = new Thread() {
-
- public void run() {
- Connection cancelConn = null;
- java.sql.Statement cancelStmt = null;
-
- try {
- cancelConn = connection.duplicate();
- cancelStmt = cancelConn.createStatement();
- // 简单暴力,再发起一条KILL SQL,关闭先前的sql thread id
- cancelStmt.execute("KILL QUERY " + connectionId);
- wasCancelled = true;
- } catch (SQLException sqlEx) {
- throw new RuntimeException(sqlEx.toString());
- } finally {
- if (cancelStmt != null) {
- try {
- cancelStmt.close();
- } catch (SQLException sqlEx) {
- throw new RuntimeException(sqlEx.toString());
- }
- }
-
- if (cancelConn != null) {
- try {
- cancelConn.close();
- } catch (SQLException sqlEx) {
- throw new RuntimeException(sqlEx.toString());
- }
- }
- }
- }
- };
-
- cancelThread.start();
- }
- }
缘由总结一句话: queryTimeout的实现是经过底层数据库提供的机制,好比KILL QUERY pid. 若是此时的网络不通,出现阻塞现象,对应的kill命令也发不出去,因此timeout设置的超时没效果。
4.最后
最后仍是决定配置testWhileIdle扫描,主要考虑:
- pool池中的连接若是未被使用,能够经过testWhileIdle进行连接检查,避免在使用时后总要失败那么一次,能够及时预防
- 配合链接池的minEvictableIdleTimeMillis(空闲连接),removeAbandoned(未释放的连接),能够更好的去避免由于一些异常状况引发的问题,防范于未然。好比使用一些分布式数据库的中间件,会有空闲连接关闭的动做,动态伸缩链接池,这时候须要能及时的发现,避免请求失败。
- testOnBorrow我的不太建议使用,存在性能问题,试想一下链接通常会在什么状况出问题,网络或者服务端异常终端空闲连接,网络中断你testOnBorrow检查发现不对再取一个连接仍是不对,针对空闲连接处理异常关闭,能够从好业务端的重试策略进行考虑,同时配置客户端的空闲连接超时时间,maxIdle,minIdle等。
--------------------------------------------
新加的内容:
5.dbcp密码加密处理
之前使用jboss的jndi数据源的方式,是经过配置oracle-ds.xml,能够设置<security-domain>EncryptDBPassword</security-domain>,引用jboss login-config.xml配置的加密配置。
Java代码

- <application-policy name="EncryptDBPassword">
- <authentication>
- <login-module code="org.jboss.resource.security.SecureIdentityLoginModule" flag="required">
- <module-option name="username">${username}</module-option>
- <module-option name="password">${password_encrypt}</module-option>
- <module-option name="managedConnectionFactoryName">jboss.jca:service=LocalTxCM,name=${jndiName}</module-option>
- </login-module>
- </authentication>
- </application-policy>
为了能达到一样的效果,切换为spring dbcp配置时,也有相似密码加密的功能,运行期进行密码decode,最后进行数据连接。
实现方式很简单,分析jboss的对应SecureIdentityLoginModule的实现,无非就是走了Blowfish加密算法,本身拷贝实现一份。
Java代码

- private static String encode(String secret) throws NoSuchPaddingException, NoSuchAlgorithmException,
- InvalidKeyException, BadPaddingException, IllegalBlockSizeException {
- byte[] kbytes = "jaas is the way".getBytes();
- SecretKeySpec key = new SecretKeySpec(kbytes, "Blowfish");
-
- Cipher cipher = Cipher.getInstance("Blowfish");
- cipher.init(Cipher.ENCRYPT_MODE, key);
- byte[] encoding = cipher.doFinal(secret.getBytes());
- BigInteger n = new BigInteger(encoding);
- return n.toString(16);
- }
-
- private static char[] decode(String secret) throws NoSuchPaddingException, NoSuchAlgorithmException,
- InvalidKeyException, BadPaddingException, IllegalBlockSizeException {
- byte[] kbytes = "jaas is the way".getBytes();
- SecretKeySpec key = new SecretKeySpec(kbytes, "Blowfish");
-
- BigInteger n = new BigInteger(secret, 16);
- byte[] encoding = n.toByteArray();
-
- Cipher cipher = Cipher.getInstance("Blowfish");
- cipher.init(Cipher.DECRYPT_MODE, key);
- byte[] decode = cipher.doFinal(encoding);
- return new String(decode).toCharArray();
- }
最后的配置替换为:
Xml代码

- <bean id="dataSource" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close">
- ......
- <property name="password"><!-- 注意多了一层转化,将密码串调用decode解密为最初的数据库密码 -->
- <bean class="com.xxxxx.EncryptDBPasswordFactory">
- <property name="password" value="${xxxx.password.encrypted}" />
- </bean>
- </property>
- ........
- </bean>
--------------------------------------------
新加的内容:
6.数据库重连机制
常见的问题:
1. 数据库意外重启后,原先的数据库链接池能自动废弃老的无用的连接,创建新的数据库连接
2. 网络异常中断后,原先的创建的tcp连接,应该能进行自动切换。好比网站演习中的交换机重启会致使网络瞬断
3. 分布式数据库中间件,好比amoeba会定时的将空闲连接异常关闭,客户端会出现半开的空闲连接。
大体的解决思路:
1. sql心跳检查
主动式 ,即我前面提到的sql validate相关配置
2. 请求探雷
牺牲小我,完成大个人精神。 拿连接尝试一下,发现处理失败丢弃连接,探雷的请求总会失败几个,就是前面遇到的问题一,dbcp已经支持该功能,不须要额外置。
3. 设置合理的超时时间,
解决半开连接. 通常数据库mysql,oracle都有必定的连接空闲断开的机制,并且当你使用一些分布式中间件(软件一类的),空闲连接控制会更加严格,这时候设置合理的超时时间能够有效避免半开连接。
通常超时时间,dbcp主要是minEvictableIdleTimeMillis(空闲连接) , removeAbandonedTimeout(连接泄漏)。能够见前面的参数解释。
参考文献:http://agapple.iteye.com/blog/772507