weblogic多池与oracle集群RAC

This exception means that the application is using a MultiPool DataSource to get JDBC connections, and all the pools defined for that MultiPool are currently unable to deliver a connection for the application to use.

Here the SOA server is unable to establish a connection to the database.web

It might show that the existing data sources status will be fine. However, they do not have the SOA server as a target. Usually the issue will be the mds-soa data source.算法

The list of data sources used by applications deployed to WebLogic Server can be viewed by either connecting to the Weblogic console and navigating to Services -> JDBC -> Data Sources or in the $MW_HOME/user_projects/domains/soa_domain/config/config.xml file.数据库

For each data source there is a separate configuration file located in the $MW_HOME/user_projects/domains/soa_domain/config/jdbc folder.服务器

Add the SOA server as a target to existing data sources using the WebLogic console and do a bounce to solve the issue.网络

转自兔八哥，配置ORACLE的RAC的数据源，WEBLOGIC的多池MULTI-POOL

WebLogic里面有多池的概念,其中High availability的含义是这样的,假设有PoolA和PoolB,正常的状况下,只有一个PoolA起做用,其poolB是stand-by,当起做用的那个poolA出现故障,则会被WLS标记为disable,并将请求转发到另一个poolB上,而且定时测试被标记为disable的poolA,若是从新链接成功后,则将请求再切换回PoolA上,PoolB继续stand-by.

而上周和一个客户讨论这个问题,客户的作法是这样的:

后台是Oracle的RAC数据库,他配置了一个多池,有2个Pool,PoolA主要连RAC的A实例,PoolB主要连RAC的B实例.其实他的PoolA和PoolB都是用了RAC格式的JDBC的写法,后面是一个主机列表,PoolA将A实例的IP写在了前面,PoolB将B实例的IP写在了前面,JDBC的算法是failover=yes load_banlance=no,这样每个Pool将请求都发送到本身的第一个host的Oracle的实例上,在第一个host的Oracle实例出现故障时候切换到另一个host的Oracle实例上.

PoolA和PoolB的JDBC的写法以下,注意failover=yes和load_banlance=yes,这样写的做用是当请求来的时候都转发给第一个host,只有出现第一个host有问题,才会将请求发送到第二个host:

WLS JDBC URL 的配置以下：

配置的多池的算法若是是High Availability的话,那么压力将始终压到一个Pool上面,另一个Pool处于stand-by的状态,除非处理请求的Pool出现故障.客户的监控状况也是如此,发现压力都压在了一个Oracle的实例上.

若是多池的算法是Load Banlance的话,那么压力将平均分配到2个Pool上面.若是想使用多池的high availability的算法,则不要设置test的重试次数,若是设置了,则会出错抛出异常.

为了能使被标记为disable的PoolA可以恢复正常的链接,则须要设置HealthCheckFrequencySeconds的值在config.xml里面,该值在console上面没有.

另外还要可以使用TestConnectionsOnReserve.

多池就是在JDBC的链接池上层又加了一层请求分流的算法层.

关于Orale的RAC的JDBC的配置请参见个人另外一篇笔记:

http://rabbit8.bokee.com/4962735.html

以上是个人理解,若有错误,请指正,由于你的指正将会让我理解更深入,谢谢!

本文参考了http://www.bea.com.cn/support_pattern/Investigating_JDBC_MultiPool_Issues_Pattern.html

当安装完了Oracle的RAC后，个人Oracle就是一个双机的集群了，支持load banlance 和failover，可是数据源里面的JDBC的URL须要一种不一样的格式：

1)BEA的例子：http://www.bea.com.cn/support_pattern/Oracle_RAC_Pattern.html

WLS JDBC URL 的配置以下：

2)IBM 的例子：http://publib.boulder.ibm.com/infocenter/wpdoc/v510/index.jsp?topic=/com.ibm.wp.ent.doc/wpf/plan_oracle_rac.html

jdbc:oracle:thin:@(DESCRIPTION=(ADDRESS_LIST=(ADDRESS=(PROTOCOL=TCP)(HOST=PRIMARY_NODE_HOSTNAME)(PORT=1521))(ADDRESS=(PROTOCOL=TCP)(HOST=SECONDARY_NODE_HOSTNAME)(PORT=1521)))(CONNECT_DATA=(SERVICE_NAME=DATABASE_SERVICENAME)))

个人试验的配置：

jdbc:oracle:thin:@(description=(address_list= (address=(host=p570_b) (protocol=tcp)(port=1521))(address=(host=p570_a)(protocol=tcp) (port=1521)) (load_balance=yes)(failover=yes))(connect_data=(service_name= orcl)))

我一开始使用的是IP地址，但发现使用IP后，第一下测试链接成功，第二下失败，第三下成功，第四下失败，就是这个规律，缘由是RAC本身就有负载均衡的功能(load banlance)，它会自动的分配负载(workload)，而第二次的请求听说返回的不是IP，因此在个人IP的列表里面没有，天然找不到(这是另外一个工程师解释给个人，不过我不太相信，由于BEA的文档中使用的就是IP，但我又不知道为何)。

后来遵从那个工程师建议改为主机名后，一切OK，但若是改主机名须要更改Windows下的WINNT/system32/drivers/etc/hosts文件，将主机名和IP对应起来。

个人RAC的数据源的配置就OK了，51后还要作DB2的双机互备的集群，还不知道该怎么作，DataSource的JDBC的URL怎么配置呢，不知道是否是和这个同样呢？

TNS的配置：

你的TNS的名字=
(DESCRIPTION =
    (ADDRESS_LIST =
      (ADDRESS = (PROTOCOL = TCP)(HOST = p570a)(PORT = 1521))
      (ADDRESS = (PROTOCOL = TCP)(HOST = p570b)(PORT = 1521))
    )
    (load_blance=yes)
    (CONNECT_DATA =
      (SERVICE_NAME = orcl)
      (failover_mode=
              (type=select)
              (method=basic))
    )
)

明天上午验收安装的AIX的HA和RAC，若是顺利的话，下午就能够回北京了，此次安装AIX和RAC都不顺利，那个安装RAC的工程师这2天被蹂躏够戗，不断的出现新的问题，一开始AIX的版本的补丁不对，结果IBM的那个工程师早早的跑了，后来找到了缘由，后来又是安装Oracle的Cluster层的软件有一个NODE没有启动，后来知道了那个NODE是否正常启动没有关系，今天又是创建RAW和导入数据出现了些问题，还好都搞定了，晚上我又测试了一下集群的数据源，明天但愿上午能够正式的测试完毕。

介绍

为了使用户的应用系统符合成本效益，高可用性和可扩展性一般是各种不一样的系统所关心的问题。在包括Java EE中间层和后台数据库的异构复杂环境汇总，有不少已知的问题。好比，一个应用请求可能会在数据库节点当机的时候被阻塞很长的时间。一般不会有什么简单的方法来判断在捕获到一个SQLException的时候，是否须要获取一个新的数据库链接。中间层应用不会知道有一个新的数据库节点或者数据库节点从新启动或者数据库节点运行的缓慢、挂起甚至已经当机，一般它们只会等待TCP/IP通信的超时。

Oracle WebLogic Server 11g为Oracle Database 11g的RAC(Real Application Cluster)特性提供强大的支持，最大限度的减小数据库的访问时间，同时容许对丰富的链接池管理功能的透明访问，最大限度的提升数据库链接池的性能和有效性。

Oracle WebLogic Server 11g RAC集成解决方案已经由Oracle融合中间件和数据库团队联合设计实施，并完成测试。它不只是市场上最好的高可用性解决方案，并且WebLogic Server也是惟一一个经过Oracle Database RAC 11g认证的应用服务器，经过WebLogic Server可以进行完整集成而不损失任何Java EE功能,包括安全，事务，链接池等等的管理。

在Oracle WebLogic Server中有两种数据源可以支持Oracle RAC：多路数据源是从WebLogic Server 8.1 SP5发布后就在用户的生产部署环境中成功应用的解决方案；Oracle WebLogic 11gR1(10.3.4)开始增长的被称做Oracle WebLogic Active GridLind for RAC的新的解决方案，该解决方案是业内领先的中间层集成解决方案，充分利用了Oracle RAC的优点。Oracle WebLogic Server Active GridLink for RAC是由Oracle推荐的支持Oracle RAC的战略性解决方案。它可以提供其余供应商产品所不具有的最佳的中间件与数据库集成的特性。

Oracle WebLogic Server数据源、数据库链接池解决方案和Oracle RAC的结合为用户提供了一个具备高性能、高可扩展性和高可用性特性的高端的任务关键型环境。负载均衡(Load-balancing)和关联(Affinity)为在线交易处理提供显著的性能提高，并提升吞吐量和整体响应时间。失效备援(Failover)为Oracle RAC节点的计划和非计划运行中断经过端到端的快速失效监测，来支持数据库的优雅关闭(Graceful Shutdown)。

在本文中，咱们首先对Oracle RAC作一个简单的介绍，并对Oracle WebLogic Server 11g所支持的Oracle RAC特性进行总体描述。而后咱们将关注WebLogic Active GridLink for RAC的详细特性和配置选项，以及样例。全部的配置步骤和应用样例将在本文中相应的“How-To”连接中进行介绍。

在每个特性中，对于多路数据源和Active GridLink for RAC的不一样支持功能都将进行清晰的解释。

ORACLE REAL APPLICATION CLUSTERS (Oracle RAC)

Oracle RAC帮助用户创建Oracle数据库集群。单实例Oracle数据库在Oracle数据库和实例之间是一对一的关系。Oracle RAC环境在数据库和实例之间是一对多的关系。

下图展现了Oracle RAC如何经过多个服务器提供的单一系统映像，访问一个Oracle数据库的。在Oracle RAC中，每个Oracle实例一般都运行在不一样的服务器之上。

Oracle RAC 11gR2的新特性

Oracle WebLogic Server 11g和Oracle 11g RAC的集成通过充分的验证，提供高可靠性，高可扩展性和高性能。Oracle RAC服务，好比失效备援、运行时链接负载均衡、关联等特性，都可以经过Oracle WebLogic Server的JDBC数据源和链接池实现。

Oracle WebLogic Server与RAC

在Java EE应用服务器中，数据库交互一般都是由数据源实现的。用户能够配置和暴露一个数据库链接做为JDBC数据源。

多路数据源

WebLogic Server JDBC子系统从WLS 8.1 SP5开始支持Oracle RAC,最初为Oracle 9i RAC所开发。该技术基于特殊的数据源配置类型，叫作多路数据源。该数据源是对一个或多个独立数据源的抽象。它为每个成员数据源的JDBC链接提供一个特定的策略。一个RAC 多路数据源配置须要每个成员数据源包含一个对特定RAC实例的链接，在下图中展现了一个三个节点的RAC集群的配置。

功能

当多路数据源算法被设置了负载均衡，应用链接以循环方式保存对每个成员数据源起做用的请求。这与失效备援相比，提高了对集群资源的使用率，而且也可以支持XA数据源。

多路数据源失效备援算法使应用链接借用一个成员数据源中的请求，直到该成员不在有效。失效备援可以在数据库链接池容量耗尽的时候发生。失效备援策略一般使用主动-被动架构。

当在一个全局事务中进行数据库访问时，JDBC链接中得到的成员数据源将关联到全局事务的生命周期当中。这能保证全部的数据库操做可以在从多路数据源中得到链接上进行执行，对于特定的事务，全部的执行都在相同的RAC实例上进行。XA关联可以提高性能，甚至是更旧版本RAC的需求，好比11g以前的版本。XA失效备援也可以被多路数据源和事务管理实现支持。若是关联的RAC实例出现失败，那么一个全局事务可使用从另外一个成员数据源中得到链接使用不一样的RAC实例来完成。

局限性

Oracle 多路数据源是一个纯中间层实现，可是并不能支持Oracle RAC的一些特性，好比Oracle通知服务(Oracle Notification Service, ONS)。所以，Oracle 多路数据源不能当即知道后台数据库发生的事情，并有以下一些局限性：

WebLogic 多路数据源须要n+1个JDBC模块，n是RAC集群中节点的数量。对RAC服务的配置，一个单独的多路数据源须要为每个RAC节点服务都进行数据源配置。此外，配置自己是静态的，在RAC集群的拓扑结构发生变化是，须要管理介入来增长或移除数据源。

多路数据源使用链接池机制来检测每个JDBC链接的有效性和RAC集群拓扑结构的变化。这种机制是对后台通知服务的替代机制。虽然有效，在独立的链接上执行SQL操做时会产生额外的开销，而且在检测RAC节点失败时可能会产生延迟。此外，还存在可能的误报，致使数据源池没必要要的废弃，终止正在被应用使用的有效链接。

WebLogic多路数据源采用循环式负载均衡实现跨越多个成员数据源的分布式均衡工做。在RAC实例表现出不一样的性能和响应时间特征，更但愿进行细粒度控制。

每个多路数据源都提供XA关联。当多个多路数据源参与到一个全局事务当中，有可能从不一样的RAC实例中获取链接。这就致使相同的全局事务的分支被不一样的RAC实例处理。尽管在最近的RAC版本中，从性能角度看，它并非最佳的。

Active GridLink for RAC

Oracle WebLogic Server 10.3.4引进了一种单数据源实现来支持Oracle RAC集群。它对FAN事件进行响应来提供快速链接故障转移(Fast Connection Failover, FCF)，运行时链接负载均衡(RCLB)和RAC实例优雅停机。在全局事务ID级别支持XA关联。这个新的特性叫作WebLogic Active GridLink for RAC，在WebLogic Server中叫作GridLink数据源。GridLink数据源经过应用通用链接池(Universal Connection Pool, UCP)的RAC集成能力来提供FCF，RCLB和关联特性。

经过关键基础来提供与Oracle RAC的深度集成，这个Oracle WebLogic Server中的单数据源实现，对于做为数据源链接目标的数据服务支持完整且无限制的应用。对于池中按链接的动态管理基于链接池自己的动态设置和链接池从RAC通知服务中得到的实时信息，Oracle通知服务(Oracle Notification Service，ONS)子系统可以向客户端通知RAC集群中的任何状态变换。

通用链接池的Java库集成在WebLogic Server中，而且被WebLogic GridLink数据源使用，来提供快速链接故障转移，运行时链接负载均衡和关联特性。

Oracle数据库服务是Oracle数据库中工做量管理的逻辑抽象。服务将工做量分解成逻辑独立的组，每个服务表明一部分带有通用属性、服务级别阈值和优先级的工做量。服务在数据库中创建，提供了一个单独的工做量系统映像，工做量优先次序，真实事务的性能测量和在性能指标没有达到时的警报和行动。服务使数据库管理员可以配置一个工做量，对它进行管理，对它进行启用或者禁止，并做为一个独立的实体测量工做量。

GridLink数据源与链接池关联，链接池包含一组隐藏在数据服务后面的，链接到RAC实例的异构链接。当一个应用从数据源中请求一个链接，根据链接池收到的负载均衡信息和池中链接使用的分布状况，一个合适的链接从池中借用而且提供给应用。

经过GridLink数据源方式，简化了Oracle RAC数据库与WLS的结合应用，下降了使用Oracle RAC的配置与管理复杂度。要注意的是，对于RAC环境的多路数据源将会被继续支持。将RAC多路数据源升级到GridLink数据源可以迅速实现，只需建立一个单独的与多路数据源的JNDI名称相同的GridLink数据源，这样可以减小人工维护的配置数量。

快速链接故障转移

快速链接故障转移特性是经过通用链接池实现的快速应用通知(Fast Application Notification, FAN)的客户端实现。该特性须要使用到一个Oracle JDBC驱动和Oracle RAC数据库或者使用一个单实例的Oracle数据库重启。

WebLogic GridLink数据源已经在通用链接池与FCF进行了集成，并将FCF用于：

Oracle RAC数据库使用ONS广播状态变化的事件。GridLink数据源可以从注册来接收从ONS发送的通知，所以可以快速感受到RAC数据库中的任何状态变化。使用这些状态变化通知，GridLink数据源可以对链接池进行智能适配，以此在RAC数据库发生变化时，还可以提供持续，可靠和高效访问。

对RAC集群状态变化适合的响应容许WebLogic Server经过当即撤销、关闭和丢弃与由于非计划中断被中止或者去掉Oracle实例的链接来处理中断，而不须要按期的轮询链接来确保他们有效，或者影响到让然存在节点的无关链接。这种评估须要对链接进行测试，来保证没有将死链接提供给应用而且快速将RAC节点失败的死连接移除，在一些失败的状况下，这些失败可能会挂起几分钟。

更进一步，它容许WebLogic Server在新的RAC实例被增长或者在中断后重启时，主动对链接进行从新分配。这就使WLS可以对RAC数据库中的资源进行彻底的利用。此外，使用数据库服务模型可以使数据库管理员对RAC服务/实例的配置进行变动，经过影响WLS链接池，无需改变链接池的配置，就可以进行平滑的应用。它也不须要像多路数据源那样建立复杂的准备，来表示RAC数据库的专用实例。

WebLogic GridLink数据源提供快速链接故障转移功能和对RAC数据库服务与节点事件(启，停)的响应来确保链接池中保存的物理链接都指向有效的数据库节点，并确保这些保存的物理链接都很好的分布在这些有效的数据库节点上。快速链接故障转移行为是做为GridLink数据源的一个配置。

运行时链接负载均衡

WebLogic GridLink数据源和JDBC链接池利用Oracle RAC数据库提供的负载均衡功能，提供更好的吞吐量和更高效的资源使用。运行时链接负载均衡须要使用Oracle JDBC驱动和Oracle RAC数据库。

Oracle性能分析显示，相对静态的轮询算法，使用运行时负载均衡有巨大的性能提高。即便RAC集群中的节点经过硬件进行了均衡，而且集群中的节点上的平均负载是复合预期的，合理并且均匀，那这种性能的提高也是很明显的。负载的瞬时差别特性一般足够使运行时链接负载均衡成为RAC集群的最佳负载均衡机制。

负载均衡公告服务发布FAN事件，向客户端通知集群的当前状态，包括建议哪里可以直接进行链接。WebLogic Server链接池接收由数据库发布的负载均衡通告事件，以下图所示将链接分布到RAC的节点之上。

链接关联(Affinity)

WebLogic GridLink数据源利用Oracle RAC数据库提供的关联功能。链接关联须要使用到Oracle JDBC驱动和11.1.0.6或更高版本的Oracle RAC数据库。

链接关联可以让链接池选择直接链接到一个特定Oracle RAC实例的链接，为客户端应用提供最好的性能。链接池使用运行时链接负载均衡来选择一个Oracle RAC实例，建立第一个链接，而后会在相同的实例上建立带有关联的链接。

基于事务的关联是既可以被客户端应用，也能被失败事件释放的与Oracle RAC实例的关联。典型的，当须要一个长时间使用的与Oracle RAC实例的关联，或者重定向到一个新的Oracle RAC实例的成本(性能方面)比较高的时候，应用系统使用这种类型的关联。参与到分布式事务中的WebLogic XA链接保持与Oracle RAC实例的关联，用于对事务进行持久化。在这种状况下，若是在分布式事务当中，一个链接重定向到不一样的Oracle RAC实例，应用系统可能会承担比较高的系能成本。

关联将基于全局事务ID创建，而不是独立的数据源，以保证链接包括不一样的数据源，这些数据源被配置到相同的RAC集群，丙炔与相同的RAC实例关联。LLR两阶段提交优化会被RAC数据源所支持，而且也参与到XA关联当中。

配置Oracle的RAC的数据源

      当安装完了Oracle的RAC后，个人Oracle就是一个双机的集群了，支持load banlance 和failover，可是数据源里面的JDBC的URL须要一种不一样的格式：
1)BEA的例子：http://www.bea.com.cn/support_pattern/Oracle_RAC_Pattern.html WLS JDBC URL 的配置以下：
jdbc:oracle:thin:@(description=(address_list= (address=(host=172.18.137.231) (protocol=tcp)(port=1521))(address=(host=172.18.137.230)(protocol=tcp) (port=1521)) (load_balance=yes)(failover=yes))(connect_data=(service_name= slrac.bea.com)))
2)IBM 的例子：http://publib.boulder.ibm.com/infocenter/wpdoc/v510/index.jsp?topic=/com.ibm.wp.ent.doc/wpf/plan_oracle_rac.html
jdbc:oracle:thin:@(DESCRIPTION=(ADDRESS_LIST=(ADDRESS=(PROTOCOL=TCP)(HOST=PRIMARY_NODE_HOSTNAME)(PORT=1521))(ADDRESS=(PROTOCOL=TCP)(HOST=SECONDARY_NODE_HOSTNAME)(PORT=1521)))(CONNECT_DATA=(SERVICE_NAME=DATABASE_SERVICENAME)))
个人试验的配置：
jdbc:oracle:thin:@(description=(address_list= (address=(host=p570_b) (protocol=tcp)(port=1521))(address=(host=p570_a)(protocol=tcp) (port=1521)) (load_balance=yes)(failover=yes))(connect_data=(service_name= orcl)))
      我一开始使用的是IP地址，但发现使用IP后，第一下测试链接成功，第二下失败，第三下成功，第四下失败，就是这个规律，缘由是RAC本身就有负载均衡的功能(load banlance)，它会自动的分配负载(workload)，而第二次的请求听说返回的不是IP，因此在个人IP的列表里面没有，天然找不到(这是另外一个工程师解释给个人，不过我不太相信，由于BEA的文档中使用的就是IP，但我又不知道为何)。

      后来遵从那个工程师建议改为主机名后，一切OK，但若是改主机名须要更改Windows下的WINNT/system32/drivers/etc/hosts文件，将主机名和IP对应起来。
      个人RAC的数据源的配置就OK了，51后还要作DB2的双机互备的集群，还不知道该怎么作，DataSource的JDBC的URL怎么配置呢，不知道是否是和这个同样呢？
     TNS的配置：你的TNS的名字=   (DESCRIPTION =     (ADDRESS_LIST =
      (ADDRESS = (PROTOCOL = TCP)(HOST = p570a)(PORT = 1521))       (ADDRESS = (PROTOCOL = TCP)(HOST = p570b)(PORT = 1521))     )
    (load_blance=yes)     (CONNECT_DATA =       (SERVICE_NAME = orcl)       (failover_mode=               (type=select)               (method=basic))     )   )
后台是Oracle的RAC数据库,他配置了一个多池,有2个Pool,PoolA主要连RAC的A实例,PoolB主要连RAC的B实例.其实他的PoolA和PoolB都是用了RAC格式的JDBC的写法,后面是一个主机列表,PoolA将A实例的IP写在了前面,PoolB将B实例的IP写在了前面,JDBC的算法是failover=yes load_banlance=no,这样每个Pool将请求都发送到本身的第一个host的Oracle的实例上,在第一个host的Oracle实例出现故障时候切换到另一个host的Oracle实例上. PoolA和PoolB的JDBC的写法以下,注意failover=yes和load_banlance=yes,这样写的做用是当请求来的时候都转发给第一个host,只有出现第一个host有问题,才会将请求发送到第二个host: WLS JDBC URL 的配置以下：

jdbc:oracle:thin:@(description=(address_list= (address=(host=172.18.137.231) (protocol=tcp)(port=1521))(address=(host=172.18.137.230)(protocol=tcp) (port=1521)) (load_balance=yes)(failover=yes))(connect_data=(service_name= slrac.bea.com))) 配置的多池的算法若是是High Availability的话,那么压力将始终压到一个Pool上面,另一个Pool处于stand-by的状态,除非处理请求的Pool出现故障.客户的监控状况也是如此,发现压力都压在了一个Oracle的实例上. 若是多池的算法是Load Banlance的话,那么压力将平均分配到2个Pool上面.若是想使用多池的high availability的算法,则不要设置test的重试次数,若是设置了,则会出错抛出异常. 为了能使被标记为disable的PoolA可以恢复正常的链接,则须要设置HealthCheckFrequencySeconds的值在 config.xml里面,该值在console上面没有. 另外还要可以使用TestConnectionsOnReserve. 多池就是在JDBC的链接池上层又加了一层请求分流的算法层.