在Oracle数据库运行期间,DBA应该对数据库的运行日志及表空间的使用状况进行监控,及早发现数据库中存在的问题。 数据库
1、Oracle警告日志文件监控 安全
Oracle在运行过程当中,会在警告日志文件(alert_SID.log)中记录数据库的一些运行状况:
●● 数据库的启动、关闭,启动时的非缺省参数;
●● 数据库的重作日志切换状况,记录每次切换的时间,及若是由于检查点(checkpoint)操做没有执行完成形成不能切换,会记录不能切换的缘由;
●● 对数据库进行的某些操做,如建立或删除表空间、增长数据文件;
●● 数据库发生的错误,如表空间不够、出现坏块、数据库内部错误(ORA-600)
DBA应该按期检查日志文件,根据日志中发现的问题及时进行处理
问题 处理
启动参数不对检查初始化参数文件
由于检查点操做或归档操做没有完成形成重作日志不能切换 若是常常发生这样的状况,能够考虑增长重作日志文件组;想办法提升检查点或归档操做的效率;
有人未经受权删除了表空间
检查数据库的安全问题,是否密码太简单;若有必要,撤消某些用户的系统权限
出现坏块
检查是不是硬件问题(如磁盘本生有坏块),若是不是,检查是那个数据库对象出现了坏块,对这个对象进行重建
表空间不够
增长数据文件到相应的表空间
出现ORA-600
根据日志文件的内容查看相应的TRC文件,若是是Oracle的bug,要及时打上相应的补丁 服务器
2、数据库表空间使用状况监控(字典管理表空间) 网络
数据库运行了一段时间后,因为不断的在表空间上建立和删除对象,会在表空间上产生大量的碎片,DBA应该及时了解表空间的碎片和可用空间状况,以决定是否要对碎片进行整理或为表空间增长数据文件。
select tablespace_name,
count(*) chunks ,
max(bytes/1024/1024) max_chunk
from dba_free_space
group by tablespace_name;
上面的SQL列出了数据库中每一个表空间的空闲块状况,以下所示:
TABLESPACE_NAME CHUNKS MAX_CHUNK
-------------------- ---------- ----------
INDX 1 57.9921875
RBS 3 490.992188
RMAN_TS 1 16.515625
SYSTEM 1 207.296875
TEMP 20 70.8046875
TOOLS 1 11.8359375
USERS 67 71.3671875
其中,CHUNKS列表示表空间中有多少可用的空闲块(每一个空闲块是由一些连续的Oracle数据块组成),若是这样的空闲块过多,好比平均到每一个数据文件上超过了100个,那么该表空间的碎片情况就比较严重了,能够尝试用以
下的SQL命令进行表空间相邻碎片的接合:
alter tablespace 表空间名 coalesce;
而后再执行查看表空间碎片的SQL语句,看表空间的碎片有没有减小。若是没有效果,而且表空间的碎片已经严重影响到了数据库的运行,则考虑对该表空间进行重建。
MAX_CHUNK列的结果是表空间上最大的可用块大小,若是该表空间上的对象所需分配的空间(NEXT值)大于可用块的大小的话,就会提示ORA-165二、ORA-165三、ORA-1654的错误信息,DBA应该及时对表空间的空间进行扩充,以免这些错误发生。
对表空间的扩充对表空间的数据文件大小进行扩展,或向表空间增长数据文件,具体操做见“存储管理”部份。 session
3、查看数据库的链接状况 oracle
DBA要定时对数据库的链接状况进行检查,看与数据库创建的会话数目是否是正常,若是创建了过多的链接,会消耗数据库的资源。同时,对一些“挂死”的链接,可能会须要DBA手工进行清理。
如下的SQL语句列出当前数据库创建的会话状况:
select sid,serial#,username,program,machine,status
from v$session;
输出结果为:
SID SERIAL# USERNAME PROGRAM MACHINE STATUS
---- ------- ---------- ----------- --------------- --------
1 1 ORACLE.EXE WORK3 ACTIVE
2 1 ORACLE.EXE WORK3 ACTIVE
3 1 ORACLE.EXE WORK3 ACTIVE
4 1 ORACLE.EXE WORK3 ACTIVE
5 3 ORACLE.EXE WORK3 ACTIVE
6 1 ORACLE.EXE WORK3 ACTIVE
7 1 ORACLE.EXE WORK3 ACTIVE
8 27 SYS SQLPLUS.EXE WORKGROUP\WORK3 ACTIVE
11 5 DBSNMP dbsnmp.exe WORKGROUP\WORK3 INACTIVE
其中,
SID 会话(session)的ID号;
SERIAL# 会话的序列号,和SID一块儿用来惟一标识一个会话;
USERNAME 创建该会话的用户名;
PROGRAM 这个会话是用什么工具链接到数据库的;
STATUS 当前这个会话的状态,ACTIVE表示会话正在执行某些任务,INACTIVE表示当前会话没有执行任何操做;
若是DBA要手工断开某个会话,则执行:
alter system kill session 'SID,SERIAL#';
注意,上例中SID为1到7(USERNAME列为空)的会话,是Oracle的后台进程,不要对这些会话进行任何操做。 工具
4、控制文件的备份 spa
在数据库结构发生变化时,如增长了表空间,增长了数据文件或重作日志文件这些操做,都会形成Oracle数据库控制文件的变化,DBA应及进行控制文件的备份,备份方法是:
执行SQL语句:
alter database
backup controlfile to '/home/backup/control.bak';
或:
alter database
backup controlfile to trace;
这样,会在USER_DUMP_DEST(初始化参数文件中指定)目录下生成建立控制文件的SQL命令。 操作系统
5、检查数据库文件的状态 日志
DBA要及时查看数据库中数据文件的状态(如被误删除),根据实际状况决定如何进行处理,检查数据文件的状态的SQL以下:
select file_name,status
from dba_data_files;
若是数据文件的STATUS列不是AVAILABLE,那么就要采起相应的措施,如对该数据文件进行恢复操做,或重建该数据文件所在的表空间。
6、检查数据库定时做业的完成状况
若是数据库使用了Oracle的JOB来完成一些定时做业,要对这些JOB的运行状况进行检查:
select job,log_user,last_date,failures
from dba_jobs;
若是FAILURES列是一个大于0的数的话,说明JOB运行失败,要进一步的检查。
7、数据库坏块的处理
当Oracle数据库出现坏块时,Oracle会在警告日志文件(alert_SID.log)中记录坏块的信息:
ORA-01578: ORACLE data block corrupted (file # 7, block # <BLOCK>)
ORA-01110: data file <AFN>: '/oracle1/oradata/V920/oradata/V816/users01.dbf'
其中,<AFN>表明坏块所在数据文件的绝对文件号,<BLOCK>表明坏块是数据文件上的第几个数据块
出现这种状况时,应该首先检查是不是硬件及操做系统上的故障致使Oracle数据库出现坏块。在排除了数据库之外的缘由后,再对发生坏块的数据库对象进行处理。
1.肯定发生坏块的数据库对象
SELECT tablespace_name,
segment_type,
owner,
segment_name
FROM dba_extents
WHERE file_id = <AFN>
AND <BLOCK> between block_id AND block_id+blocks-1;
2.决定修复方法
若是发生坏块的对象是一个索引,那么能够直接把索引DROP掉后,再根据表里的记录进行重建;
若是发生坏块的表的记录能够根据其它表的记录生成的话,那么能够直接把这个表DROP掉后重建;
若是有数据库的备份,则恢复数据库的方法来进行修复;
若是表里的记录没有其它办法恢复,那么坏块上的记录就丢失了,只能把表中其它数据块上的记录取出来,而后对这个表进行重建。
3.用Oracle提供的DBMS_REPAIR包标记出坏块
exec DBMS_REPAIR.SKIP_CORRUPT_BLOCKS('<schema>','<tablename>');
4.使用Create table as select命令将表中其它块上的记录保存到另外一张表上
create table corrupt_table_bak
as
select * from corrupt_table;
5.用DROP TABLE命令删除有坏块的表
drop table corrupt_table;
6.用alter table rename命令恢复原来的表
alter table corrupt_table_bak
rename to corrupt_table;
7.若是表上存在索引,则要重建表上的索引
8、操做系统相关维护
DBA要注意对操做系统的监控:
●● 文件系统的空间使用状况(df -k),必要时对Oracle的警告日志及TRC文件进行清理
●● 若是Oracle提供网络服务,检查网络链接是否正常
●● 检查操做系统的资源使用状况是否正常
●● 检查数据库服务器有没有硬件故障,如磁盘、内存报错