Oracle 10g RAC TAF介绍

Oracle 10g RAC TAF介绍html

转自:http://www.cnblogs.com/einyboy/archive/2012/11/19/2777855.htmlnode


  Oracle RAC 同时具有HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点
的故障都不会影响用户的使用,链接到故障节点的用户会被自动转移到健康节点,从用户感觉而言, 是感受不到这种切换。
Oracle 10g RAC 的Failover 能够分为3种:
1. Client-Side Connect time Failover
2. Client-Side TAF
3. Service-Side TAF

注意事项: 不能在listener.ora 文件中设置GLOBAL_NAME, 由于这个参数会禁用Connect-time Failover 和 Transparent Application Failover.

一.Client-Side Connect Time Failover

Client-Side Connect Time Failover的含义:若是用户端tnsname 中配置了多个地址,用户发起链接请求时,会先尝试链接地址表中的第一
个地址,若是这个链接尝试失败,则继续尝试使用第二个地址,直至链接成功或者遍历了全部的地址。
这种Failover的特色:只在创建链接那一时刻起做用,也就是说,这种Failover方式只在发起链接时才会去感知节点故障,若是节点没有
反应,则自动尝试地址列表中的下一个地址。一旦链接创建以后,节点出现故障都不会作处理,从客户端的表现就是会话断开了,用户
程序必须从新创建链接。
启用这种Failover的方法就是在客户端的tnsnames.ora中添加FAILOVER=ON 条目,这个参数默认就是ON,因此即便不添加这个条目,
客户端也会得到这种Failover能力。
示例:
VICTOR =
 (DESCRIPTION =
   (ADDRESS = (PROTOCOL = TCP)(HOST = node01-vip)(PORT = 1521))
   (ADDRESS = (PROTOCOL = TCP)(HOST = node02-vip)(PORT = 1521))
   (LOAD_BALANCE = yes)
   (CONNECT_DATA =
     (SERVER = DEDICATED)
     (SERVICE_NAME = vic)
   )
 )
注:node01-vip,node02-vip要添加到hosts 文件中,否则可能解析不了。

二. Client-Side TAF(Transparent Application Failover)
如今的大部分流行的应用系统(如:weblogic, Jboss),都是启动时就创建若干到数据库的长链接,在应用程序整个生命周期内重用这些
链接。 而Client-Side Connet Time Failover的工做方式使它对应用程序的可用性没有太大帮助。
因此从Oracle 8.1.5 版本只有引入了新的Failover 机制—TAF。 所谓TAF,就是链接创建之后,应用系统运行过程当中,若是某个实例发
生故障,链接到这个实例上的用户会被自动迁移到其余的健康实例上。对于应用程序而言,这个迁移过程是透明的,不须要用户的介
入,固然,这种透明要是有引导的,由于用户的未提交事务会回滚。 相对与Client-Side Connect Time Failover的用户程序中断(抛出
链接错误,用户必须重启应用程序),TAF这种方式在提升HA上有了很大的进步。
TAF 的配置也很简单,只须要在客户端的tnsnames.ora中添加FAILOVER_MODE配置项。这个条目有4个子项目须要定义。
1. METHOD: 用户定义什么时候建立到其实例的链接,有BASIC 和 PRECONNECT 两种可选值。
BASIC: 是指在感知到节点故障时才建立到其余实例的链接。
PRECONNECT:是在最初创建链接时就同时创建到全部实例的链接,当发生故障时,马上就能够切换到其余链路上。
注意:server-side TAF的failover方式没法设置为PRECONNECT,只能设置为BASIC,10g,11g都是如此。因此,若是failover方式要设定
为PRECONNECT,就只能使用client-side TAF。
两种方法比较: BASIC方式在Failover时会有时间延迟,PRECONNECT方式虽然没有时间延迟,可是创建多个冗余链接会消耗更多资源,
二者就是是用时间换资源和用资源换时间的区别。
2. TYPE: 用于定义发生故障时对完成的SQL 语句如何处理,其中有2种类型:session 和select.
这2种方式对于未提交的事务都会自动回滚,区别在于对select 语句的处理,对于select,用户正在执行的select语句会被转移到新的实例
上,在新的节点上继续返回后续结果集,而已经返回的记录集则抛弃。
假设用户正在节点1上执行查询,整个结果集共有10000条记录,如今已从节点1上返回9000条记录,这时节点1宕机,用户链接被转移到节
点2上,若是是session模式,则须要从新执行查询语句;若是是select方式,会从节点2上继续返回剩下的1000条记录,而已经从节点1返
回的9000条记录不会重复返回给用户,对于用户而言,感觉不到这种切换。
显然为了实现select 方式,Oracle 必须为每一个session保存更多的内容,包括游标,用户上下文等,须要更多的资源也是用资源换时间
的方案。
3. DELAY 和 RETRIES: 这2个参数分别表明重试间隔时间和重试次数。
示例:
DCSRV =
 (DESCRIPTION =
   (ADDRESS = (PROTOCOL = TCP)(HOST = node01-vip)(PORT = 1521))
   (ADDRESS = (PROTOCOL = TCP)(HOST = node02-vip)(PORT = 1521))
   (LOAD_BALANCE = yes)
   (CONNECT_DATA =
     (SERVER = DEDICATED)
     (SERVICE_NAME = dcsrv)
     (FAILOVER_MODE =
       (TYPE = SELECT)
       (METHOD = BASIC)
       (RETRIES = 180)
       (DELAY = 5)
     )
   )
 )

三. Service-Side TAF
Service-SideTAF 能够看做是TAF的一种变种,首先Service-SideTAF也是TAF,全部TAF的特色它都有,其次这种TAF是在服务器上配
置的,而不像TAF是在客户端配置的。
Client-Side TAF 是在客户端修改tnsnames.ora 文件来配置的,若是有不少客户端使用这个数据库,那么每次微小调整都须要把全部的
计算机更改一遍,既低效又容易出错。而Service-Side TAF 经过结合Service,在数据库里保存FAIL_MODE的配置,把全部的TAF配置
保存在数据字典中,从而省去了客户端的配置工做,如今客户端的TNS文件就不须要任何TAF的配置选项了。
从配置参数而言,Service-Side TAF和TAF 相比多了一个Instance Role(实例角色)的概念。 所谓的实例角色,就是当有多个Instance 参
与一个Service时,能够配置优先使用哪个Instance为用户提供服务。用户共有两种可选角色。
PREFERRED:首选实例,会优先选择拥有这个角色的实例提供服务。
AVAILABLE: 后备实例,用户链接会优先链接PREFFERRED的Instance,当PREFERRED的Instance不可用时,才会被转到AVAILBALE
的Instance上。
要使用Server-Side TAF,第一步,必须配置Service。 Service 能够在建立数据库时建立,也能够在建立数据库以后修改,既可使用
dbca 配置向导,也能够用命令行的 方式配置。第二步,必须经过dbms_service包来配置TAF策略选项。
注意:server-side的TAF策略会覆盖掉client-side的TAF策略,因此若是使用client-side TAF链接数据库而不想使用server-side的策略,
就只能使用另一个service。

3.1 用DBCA 配置Service
1). 运行DBCA,选择ORACLE RAC Application Clusters database
2). 在第二个界面选择:Services Management
3). 第三个界面会出现RAC 数据库列表,用户能够在这个列表中选择要配置Service 的数据库
4). 在Serice配置界面中,单击Add 建立新的Service,输入service名字。在Instance列表框定义实例角色,选择那个service1 做为
Preferred(首选实例),Service2 做为availiable(后备实例)。 TAF Policy有三个选项: None, Basic,Pre-connect。 咱们选Basic。 最
后点击Finish,完成Service 配置。
5)在结束Service配置后,服务会自动启动。

3.2 用srvctl 命令配置Service

用命令行方式配置Service 对远程维护颇有用。 先来看一下相关命令
1) 建立service
#Srvctl add service -d <database-name> -s <service-name> -r "preferred-instance-list" -a "available-instance-list" -P <TAF-policy>
其中TAF-Policy可选:basic 和 preconnect。 例如:
srvctl add service -d RAC -s Service2 -r "RAC1,RAC2" -a "RAC3,RAC4" -P basic
注意:srvctl add service中,只有perferred才会建立服务。 即在OCR中注册一个ora.vic.dcsrv.vic1.Srv的服务。
2) 查看配置信息
#srvctl config service -d database-name [-s service-name] [-a]
若是这里不指定"-s service-name",就会显示全部Service的配置,这些配置包括preferred 和available instance. 使用-a 选项,还会显示
TAF 相关信息。
3) 是否自动运行service
数据库启动时,会自动启动全部的Service。有时为了为了维护须要,须要禁用这个特性,在维护完成后再启动这个特性。
#srvctl enable/disable service -d database-name -s service-name -i instance-name
4)启动service
#srvctl start service -d <database-name> -s <service-name> -i instance-name -o start-option -c connect-string -q
若是不指定service-name, 则全部的service 都会被启动,可使用逗号分隔方式,同时启动多个service。 -i 指定在那个实例上启动service。
5) 中止service
#srvctl stop service -d <database-name> -s <service-name> -i instance-name -c connect-string -q -f
其中-f 选项能够强制关闭service,并中断了其全部用户的链接。
6) 查看service 状态
#srvctl status service -d <database-name> -s service-name -i instance-name -f -v
其中-f 能够显示被disable的instance 信息,而-v 能够显示详细输出
7) 删除service
#srvctl remove service -d database-name -s service-name -i instance-name [-f]
注意:在使用srvctl 建立service时,须要注意TAF策略选项必须经过dbms_service包来配置。
示例:
begin
dbms_service.modify_service(
service_name='>service1',
failover_method=>dbms_service.failover_method_basic,
failover_type=>dbms_service.failover_type_select,
failover_retries=>180,
failover_delay=>5);
end;

3.3 配置Service 的注意事项
1). 数据库的服务名是用service_name 参数来指定的,一个数据库能够有多个服务名,可是service_name最长是4kb,不要手工来修改
这个参数
2)最多能够建立64个service,每一个数据库有2个隐含的service,所以留给用户的就只有62个service。不能修改这两个隐含service的配
置,而且也不能手工启动或中止这2个服务。 这两个隐含的service分别是:SYS$BACKGROUND 和 SYS$USERS.
3) 当使用dbca配置Service 时,dbca 会自动更新OCR,启动Service, 当删除service时,会中止service,并更新OCR.
4) 使用srvctl 这个工具时,命令只更新OCR中的配置,不会更新data dctionary 和 listener 中的信息,所以还须要使用dbma_servie 包来更
新data dictionary,手工更改listener配置文件。 故推荐使用DBCA工具来配置更改service配置
5) 若是客户端想经过Service 方式链接数据库,须要在tns条目中使用service_name 方式引用数据库。 如:
VICTOR =
 (DESCRIPTION =
   (ADDRESS = (PROTOCOL = TCP)(HOST = node01-vip)(PORT = 1521))
   (ADDRESS = (PROTOCOL = TCP)(HOST = node02-vip)(PORT = 1521))
   (LOAD_BALANCE = yes)
   (CONNECT_DATA =
     (SERVER = DEDICATED)
     (SERVICE_NAME = vic)
   )
 )
注意:不管是使用dbca 工具仍是使用srvctl 命令来配置service,都没法配置TAF的TYPE,DELAY,RETRIES 三个属性,必须使用
dbms_service包来修改这些属性。

四. Srvctl 命令测试实例
先查看一下RAC 启动状况:
[[oracle@node1 ~]# ./crs_stat -t
Name           Type           Target    State     Host
------------------------------------------------------------
ora.vic.db application ONLINE ONLINE node1
ora.vic.vic.cs application ONLINE ONLINE node1
ora....ic1.srv application ONLINE ONLINE node1
ora....ic2.srv application ONLINE ONLINE node2
ora....w1.inst application ONLINE ONLINE node1
ora....w2.inst application ONLINE ONLINE node2
ora....SM1.asm application ONLINE ONLINE node1
ora....W1.lsnr application ONLINE ONLINE node1
ora.vic1.gsd application ONLINE ONLINE node1
ora.vic1.ons application ONLINE ONLINE node1
ora.vic1.vip application ONLINE ONLINE node1
ora....SM2.asm application ONLINE ONLINE node2
ora....W2.lsnr application ONLINE ONLINE node2
ora.vic2.gsd application ONLINE ONLINE node2
ora.vic2.ons application ONLINE ONLINE node2
ora.vic2.vip application ONLINE ONLINE node2
[[oracle@node1 ~]# ps -ef|grep smon
root 12489 5411 0 09:30 pts/1 00:00:00 grep smon
oracle 19466 1 0 09:06 ? 00:00:03 asm_smon_+ASM1
oracle 19985 1 0 09:06 ? 00:00:02 ora_smon_vic1
一切正常。
1) 查看现有的service
[[oracle@node1 ~]$ export ORACLE_SID=vic1
[[oracle@node1 ~]$ sqlplus /nolog
SQL*Plus: Release 10.2.0.4.0 - Production on Mon Aug 6 11:01:31 2012
Copyright (c) 1982, 2005, Oracle. All rights reserved.
SQL> conn / as sysdba
Connected.
SQL> show parameter service
NAME                                 TYPE        VALUE
------------------------------------ ----------- ------------------------------
service_names                        string       vic
SQL>
2)使用srvctl 命令建立dcsrv 服务
[[oracle@node1 ~]$ srvctl add service -d vic -s dcsrv -r "vic1,vic2" -P basic
[[oracle@node1 ~]$ crs_stat -t
Name           Type           Target    State     Host
------------------------------------------------------------
ora.vic.db application ONLINE ONLINE node1
ora.vic.dcsrv.cs application OFFLINE OFFLINE
ora....ic1.srv application OFFLINE OFFLINE
ora....ic2.srv application OFFLINE OFFLINE
ora....c1.inst application ONLINE ONLINE node1
ora....c2.inst application ONLINE ONLINE node2
ora....SM1.asm application ONLINE ONLINE node1
ora....W1.lsnr application ONLINE ONLINE node1
ora.vic1.gsd application ONLINE ONLINE node1
ora.vic1.ons application ONLINE ONLINE node1
ora.vic1.vip application ONLINE ONLINE node1
ora....SM2.asm application ONLINE ONLINE node2
ora....C2.lsnr application ONLINE ONLINE node2
ora.vic2.gsd application ONLINE ONLINE node2
ora.vic2.ons application ONLINE ONLINE node2
ora.vic2.vip application ONLINE ONLINE node2
[[oracle@node1 ~]$ srvctl add service -d vic -s dcsrv -r vic1 -a vic2 -P basic
注意:srvctl add service中,只有perferred才会建立服务。 即在OCR中注册一个ora.vic.dcsrv.vic1.Srv的服务。

3)确认服务建立成功,offline 表示尚未启动
[[oracle@node1 ~]$ crs_stat -t
Name           Type           Target    State     Host
------------------------------------------------------------
ora.vic.db application ONLINE ONLINE node1
ora.vic.dcsrv.cs application OFFLINE OFFLINE
ora....ic1.srv application OFFLINE OFFLINE
ora.vic.vic.cs application ONLINE ONLINE node1
ora....ic1.srv application ONLINE ONLINE node1
ora....c1.inst application ONLINE ONLINE node1
ora....c2.inst application ONLINE ONLINE node2
ora....SM1.asm application ONLINE ONLINE node1
ora....W1.lsnr application ONLINE ONLINE node1
ora.vic1.gsd application ONLINE ONLINE node1
ora.vic1.ons application ONLINE ONLINE node1
ora.vic1.vip application ONLINE ONLINE node1
ora....SM2.asm application ONLINE ONLINE node2
ora....C2.lsnr application ONLINE ONLINE node2
ora.vic2.gsd application ONLINE ONLINE node2
ora.vic2.ons application ONLINE ONLINE node2
ora.vic2.vip application ONLINE ONLINE node2
4)配置这个服务自启动
[[oracle@node1 ~]$ srvctl enable service -d vic -s dcsrv
PRKP-1018 : Service dcsrv already enabled.
5)启动服务
[[oracle@node1 ~]$ srvctl start service -d vic -s dcsrv
6)确认服务状态。Online 说明已启动
[[oracle@node1 ~]$ crs_stat -t
Name           Type           Target    State     Host
------------------------------------------------------------
ora.vic.db application ONLINE ONLINE node1
ora.vic.dcsrv.cs application ONLINE ONLINE node1
ora....ic1.srv application ONLINE ONLINE node1
ora.vic.vic.cs application ONLINE ONLINE node1
ora....w1.inst application ONLINE ONLINE node1
ora....w2.inst application ONLINE ONLINE node2
ora....SM1.asm application ONLINE ONLINE node1
ora....W1.lsnr application ONLINE ONLINE node1
ora.vic1.gsd application ONLINE ONLINE node1
ora.vic1.ons application ONLINE ONLINE node1
ora.vic1.vip application ONLINE ONLINE node1
ora....SM2.asm application ONLINE ONLINE node2
ora....W2.lsnr application ONLINE ONLINE node2
ora.vic2.gsd application ONLINE ONLINE node2
ora.vic2.ons application ONLINE ONLINE node2
ora.vic2.vip application ONLINE ONLINE node2
新建的服务会自动添加到初始话参数中:
SQL> show parameter service
NAME                                 TYPE        VALUE
------------------------------------ ----------- ------------------------------
service_names                        string      dcsrv, vic
7)用service TAF 修改配置,须要用dbms_service.modify_service包。
SQL> begin
dbms_service.modify_service(
service_name=>'dcsrv',
failover_method=>dbms_service.failover_method_basic,
failover_type=>dbms_service.failover_type_select,
failover_retries=>180,
failover_delay=>5);
end;
/
PL/SQL procedure successfully completed.
8) 确认参数已经生效
SQL> select name,failover_method,failover_type,goal,clb_goal from dba_services;
NAME                 FAILOVER_METHOD      FAILOVER_TYPE        GOAL         CLB_G
-------------------- ------------------------------------ -------------------------------- --------------- -------------
SYS$BACKGROUND                                         NONE         SHORT
SYS$USERS                                                 NONE         SHORT
vic                                                                       LONG
dcsrv             BASIC                  SELECT              NONE         LONG
9) 也能够用srvctl 命令查看配置状况
[[oracle@node1 ~]$ srvctl config service -d vic -s dcsrv -a
dcsrv PREF: vic1 AVAIL: vic2 TAF: basic
10) 删除Service
先关闭service:
[[oracle@node1 ~]$ srvctl stop service -d vic -s dcsrv
[[oracle@node1 ~]$ srvctl disable service -d vic -s dcsrv
删除服务:
[[oracle@node1 ~]$ srvctl remove service -d vic -s dcsrv
dcsrv PREF: vic1 AVAIL: vic2
Service dcsrv is disabled.
Remove service dcsrv from the database vic? (y/[n]) y
若是该命令清楚不掉,咱们能够加上-f 参数
[[oracle@node1 ~]# ./srvctl remove service -d vic -s dcsrv -f
OCR中的信息已经被删除了,可是数据字典中的还有该service的内容,继续清除数据字典中的内容。
先查看数据字典内容:
SQL> select name,failover_method,failover_type,goal,clb_goal from dba_services;
NAME                 FAILOVER_METHOD      FAILOVER_TYPE        GOAL         CLB_G
-------------------- ------------------------------- ---------------------------- --------------- -------------
SYS$BACKGROUND                                                                      NONE         SHORT
SYS$USERS                                                                                   NONE         SHORT
vic                                                                                                                      LONG
dcsrv                   BASIC                              SELECT                       NONE         LONG
清除数据字典里的内容:
SQL> begin
2 dbms_service.delete_service(service_name=>'dcsrv');
3 end;
4 /
PL/SQL procedure successfully completed.
再次查询数据字典,没有了数据。清除完成
SQL> select name,failover_method,failover_type,goal,clb_goal from dba_services;
NAME                 FAILOVER_METHOD      FAILOVER_TYPE        GOAL         CLB_G
-------------------- ------------------------------- ---------------------------- --------------- -------------
SYS$BACKGROUND                                                                     NONE         SHORT
SYS$USERS                                                                                  NONE         SHORT
vic                                                                                                                     LONG
web

相关文章
相关标签/搜索