Oracle RAC Failover 详解

Oracle  RAC 同时具有HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用,链接到故障节点的用户会被自动转移到健康节点,从用户感觉而言, 是感受不到这种切换。   linux

 

Oracle 10g RAC 的Failover 能够分为3种: web

1. Client-Side Connect time Failover 数据库

2. TAF session

3. Service-Side TAF ide

 

注意事项: 不能在listener.ora 文件中设置GLOBAL_NAME, 由于这个参数会禁用Connect-time Failover 和 Transparent Application Failover. spa

 

一.Client-Side Connect Time Failover blog

Client-Side Connect Time Failover的含义:若是用户端tnsname 中配置了多个地址,用户发起链接请求时,会先尝试链接地址表中的第一个地址,若是这个链接尝试失败,则继续尝试使用第二个地址,直至链接成功或者遍历了全部的地址。 生命周期

这 种Failover的特色: 只在创建链接那一时刻起做用,也就是说,这种Failover方式只在发起链接时才会去感知节点故障,若是节点没有反应,则 自动尝试地址列表中的下一个地址。一旦链接创建以后,节点出现故障都不会作处理,从客户端的表现就是会话断开了,用户程序必须从新创建链接。 事务

启用这种Failover的方法就是在客户端的tnsnames.ora中添加FAILOVER=ON 条目,这个参数默认就是ON,因此即便不添加这个条目,客户端也会得到这种Failover能力。 ip

 

示例:

RAC =

  (DESCRIPTION =

     (ADDRESS = (PROTOCOL = TCP)(HOST = rac1-vip)(PORT = 1521))

     (ADDRESS = (PROTOCOL = TCP)(HOST = rac2-vip)(PORT = 1521))

     (LOAD_BALANCE=YES)

      (

 CONNECT_DATA=

     (SERVER=DEDICATED)

 (SERVICE_NAME=RAC)

      )

    )

注:rac1-vip,rac2-vip要添加到hosts 文件中,否则可能解析不了。

 

二. TAF(Transparent Application Failover)

 

 

这块的配置,参考:

10g & 11g Configuration of TAF(Transparent Application Failover) and Load Balancing [ID 453293.1]

现 在的大部分流行的应用系统(如:weblogic, Jboss),都是启动时就创建若干到数据库的长链接,在应用程序整个生命周期内重用这些链接。 而 Client-Side Connet Time Failover的工做方式是它对应用程序的可用性没有太大帮助。 

所 以从Oracle 8.1.5 版本只有引入了新的Failover 机制—TAF。 所谓TAF,就是链接创建之后,应用系统运行过程当中,若是某个实例 发生故障,链接到这个实例上的用户会被自动迁移到其余的健康实例上。对于应用程序而言,这个迁移过程是透明的,不须要用户的介入,固然,这种透明要是有引 导的,由于用户的未提交事务会回滚。 相对与Client-Side Connect Time Failover的用户程序中断,抛出链接错误,用户必 须重启应用程序,TAF 这种方式在提升HA上有了很大的进步。

TAF 的配置也很简单,只须要在客户端的tnsnames.ora中添加FAILOVER_MODE配置项。这个条目有4个子项目须要定义。

1. METHOD: 用户定义什么时候建立到其实例的链接,有BASIC 和 PRECONNECT 两种可选值。 

       BASIC: 是指在感知到节点故障时才建立到其余实例的链接。

       PRECONNECT: 是在最初创建链接时就同时创建到全部实例的链接,当发生故障时,马上就能够切换到其余链路上。

两种方法比较: BASIC方式在Failover时会有时间延迟,PRECONNECT方式虽然没有时间延迟,可是创建多个冗余链接会消耗更多资源,二者就是是用时间换资源和用资源换时间的区别。

2. TYPE: 用于定义发生故障时对完成的SQL 语句如何处理,其中有2种类型:session 和select.

这2种方式对于未提交的事务都会自动回滚,区别在于对select 语句的处理,对于select,用户正在执行的select语句会被转移到新的实例上,在新的节点上继续返回后续结果集,而已经返回的记录集则抛弃。

假 设用户正在节点1上执行查询,整个结果集共有100条记录,如今已从节点1上返回10条记录,这时节点1宕机,用户链接被转移到节点2上,若是是 session模式,则须要从新执行查询语句;若是是select方式,会从节点2上继续返回剩下的90天记录,而已经从节点1返回的10条记录不会重复 返回给用户,对于用户而言,感觉不到这种切换。

显然为了实现select 方式,Oracle 必须为每一个session保存更多的内容,包括游标,用户上下文等,须要更多的资源也是用资源换时间的方案。

3. DELAY 和 RETRIES: 这2个参数分别表明重试间隔时间和重试次数。

示例:

RAC =

  (DESCRIPTION =

     (ADDRESS = (PROTOCOL = TCP)(HOST = rac1-vip)(PORT = 1521))

     (ADDRESS = (PROTOCOL = TCP)(HOST = rac2-vip)(PORT = 1521))

      (LOAD_BALANCE=YES)

      (

 CONNECT_DATA=

     (SERVER=DEDICATED)

 (SERVICE_NAME=RAC)

 (

    FAILOVER_MODE=

(TYPE=session)

(METHOD=basic)

(RETRIES=180)

(DELAY=5)

 )

      )

    )

相关文章
相关标签/搜索