分区是一把双刃剑 要分区绝对要根据实际状况来分析 而我所遇到的状况及时最利于分区的sql
sql编程的艺术 做者说过 “对分区表进行查询,当数据按分区键均匀分布时,受益最大。”编程
而我采用的分区键是日子表的日志插入时间 按照一个月分一区,由于这个表每月都有基本平衡的频率的数据插入, 这样表中的全部数据就能够均匀的分布到每一区。oracle
使人激动的一天不算以前的学习研究 这个就花了我一下午less
以前日志表700多万数据,涉及到日志表的业务查询速度很慢一个月的数据查询也将近30秒左右,研究发现oracle有表分区功能 11G更加有智能按月分区功能 开干:学习
前提确认能的表能够分区测试
第一步,先建立分区的表spa
--INTERVAL分区
--这个实际上是范围分区的加强功能,经过这个功能能够实如今须要的时候自动的实现新的分区的添加,从而省去了你不断的ADD或者SPLIT新的分区。日志
CREATE TABLE SYS_LOG_TEM(pid NUMBER not null,
yhdm VARCHAR2(30),
bmdm VARCHAR2(12),
pdaid VARCHAR2(512),
simid VARCHAR2(50),
logmodule VARCHAR2(1),
logtype VARCHAR2(4),
operatetype CHAR(1),
methodname VARCHAR2(100),
methodinfo VARCHAR2(2000),
execstatus VARCHAR2(1),
execerrorinfo VARCHAR2(1000),
alltimespent NUMBER,
proxytimespent NUMBER,
logcontent VARCHAR2(4000),
logtime DATE default sysdate,
memo VARCHAR2(200),
returnflag CHAR(1),
returninfo VARCHAR2(1000),
gpsx VARCHAR2(20),
gpsy VARCHAR2(20))
PARTITION BY RANGE (logtime)
INTERVAL (NUMTOYMINTERVAL(1, 'MONTH'))
(PARTITION P1 VALUES LESS THAN (TO_DATE('2012-4-1', 'YYYY-MM-DD')));索引
(由于我表里目前的数据最小的是4月份的,因此我让它从四月份开始分区)it
第二步,把老的日志表的数据插入到新建的分区表 insert into SYS_LOG_TEM select * from SYS_LOG;
insert into SYS_LOG_TEM
select pid,
yhdm,
bmdm,
pdaid,
simid,
logmodule,
logtype,
operatetype,
methodname,
methodinfo,
execstatus,
execerrorinfo,
alltimespent,
proxytimespent,
logcontent,
nvl(logtime,to_date('2008-06-01 00:00:00','yyyy-MM-dd HH24:mi:ss')),
memo,
returnflag,
returninfo,
gpsx,
gpsy
from SYS_LOG;
数据7272844条 总共花了我7分钟多
这里之因此对logtim字段作null处理是由于一旦oracle 表作的按月分区就不能让时间字段为null不然 更新的时候会报错 ora-14402 更新分区关键字列将致使分区的更改
update sys_log_tem set logtime=null where logtime=to_date('2008-06-01 00:00:00','yyyy-MM-dd HH24:mi:ss'),不知道有没有别的办法解决这个问题,不过我这样作应该也能够本身取一个自定义时间也是说得过去的
通过plsql上的测试
查询速度对比
--作了按每个月分区的表查询 执行时间 :0.468秒
select count(pid) from ( select sysLog.pid,sysLog.yhdm,sysLog.operateType,sysLog.methodName,
sysLog.pdaId,sysLog.simId,sysLog.logContent,sysLog.logModule,sysLog.logTime from sys_log_tem sysLog,
Acl_User u where sysLog.yhdm(+)=u.yhdm and sysLog.logTime>=to_date('2012-06-01 15:48:03','yyyy-mm-dd HH24:MI:SS')
and sysLog.logTime<=to_date('2012-06-30 15:48:11','yyyy-mm-dd HH24:MI:SS'))
--这是没有作分区的表查询 执行时间 :18秒
select count(pid) from ( select sysLog.pid,sysLog.yhdm,sysLog.operateType,sysLog.methodName,
sysLog.pdaId,sysLog.simId,sysLog.logContent,sysLog.logModule,sysLog.logTime from Sys_Log sysLog,
Acl_User u where sysLog.yhdm(+)=u.yhdm and sysLog.logTime>=to_date('2012-06-01 15:48:03','yyyy-mm-dd HH24:MI:SS')
and sysLog.logTime<=to_date('2012-06-30 15:48:11','yyyy-mm-dd HH24:MI:SS'))
有一个说下新建的分区表我只建了 主键 其余都没弄 由于我发现再建日期索引的话查询速度慢了n多,比老表的速度还要慢,不知道这是什么缘由,反正我新建的表就弄了一个主键,view sql的结构是这样的:
-- Create table
create table SYS_LOG
(
pid NUMBER not null,
yhdm VARCHAR2(30),
bmdm VARCHAR2(12),
pdaid VARCHAR2(512),
simid VARCHAR2(50),
logmodule VARCHAR2(1),
logtype VARCHAR2(4),
operatetype CHAR(1),
methodname VARCHAR2(100),
methodinfo VARCHAR2(2000),
execstatus VARCHAR2(1),
execerrorinfo VARCHAR2(1000),
alltimespent NUMBER,
proxytimespent NUMBER,
logcontent VARCHAR2(4000),
logtime DATE default sysdate,
memo VARCHAR2(200),
returnflag CHAR(1),
returninfo VARCHAR2(1000),
gpsx VARCHAR2(20),
gpsy VARCHAR2(20)
)
partition by range (LOGTIME)
(
partition P1 values less than (TO_DATE(' 2012-04-01 00:00:00', 'SYYYY-MM-DD HH24:MI:SS', 'NLS_CALENDAR=GREGORIAN'))
tablespace SYSTEM
pctfree 10
pctused 40
initrans 1
maxtrans 255
storage
(
initial 64K
next 1M
minextents 1
maxextents unlimited
),
partition SYS_P22 values less than (TO_DATE(' 2012-05-01 00:00:00', 'SYYYY-MM-DD HH24:MI:SS', 'NLS_CALENDAR=GREGORIAN'))
tablespace SYSTEM
pctfree 10
pctused 40
initrans 1
maxtrans 255
storage
(
initial 64K
next 1M
minextents 1
maxextents unlimited
),
partition SYS_P23 values less than (TO_DATE(' 2012-06-01 00:00:00', 'SYYYY-MM-DD HH24:MI:SS', 'NLS_CALENDAR=GREGORIAN'))
tablespace SYSTEM
pctfree 10
pctused 40
initrans 1
maxtrans 255
storage
(
initial 64K
next 1M
minextents 1
maxextents unlimited
),
partition SYS_P24 values less than (TO_DATE(' 2012-07-01 00:00:00', 'SYYYY-MM-DD HH24:MI:SS', 'NLS_CALENDAR=GREGORIAN'))
tablespace SYSTEM
pctfree 10
pctused 40
initrans 1
maxtrans 255
storage
(
initial 64K
next 1M
minextents 1
maxextents unlimited
),
partition SYS_P25 values less than (TO_DATE(' 2012-08-01 00:00:00', 'SYYYY-MM-DD HH24:MI:SS', 'NLS_CALENDAR=GREGORIAN'))
tablespace SYSTEM
pctfree 10
pctused 40
initrans 1
maxtrans 255
storage
(
initial 64K
next 1M
minextents 1
maxextents unlimited
),
partition SYS_P26 values less than (TO_DATE(' 2012-09-01 00:00:00', 'SYYYY-MM-DD HH24:MI:SS', 'NLS_CALENDAR=GREGORIAN'))
tablespace SYSTEM
pctfree 10
pctused 40
initrans 1
maxtrans 255
storage
(
initial 64K
next 1M
minextents 1
maxextents unlimited
),
partition SYS_P27 values less than (TO_DATE(' 2012-10-01 00:00:00', 'SYYYY-MM-DD HH24:MI:SS', 'NLS_CALENDAR=GREGORIAN'))
tablespace SYSTEM
pctfree 10
pctused 40
initrans 1
maxtrans 255
storage
(
initial 64K
next 1M
minextents 1
maxextents unlimited
),
partition SYS_P28 values less than (TO_DATE(' 2012-11-01 00:00:00', 'SYYYY-MM-DD HH24:MI:SS', 'NLS_CALENDAR=GREGORIAN'))
tablespace SYSTEM
pctfree 10
pctused 40
initrans 1
maxtrans 255
storage
(
initial 64K
next 1M
minextents 1
maxextents unlimited
),
partition SYS_P29 values less than (TO_DATE(' 2012-12-01 00:00:00', 'SYYYY-MM-DD HH24:MI:SS', 'NLS_CALENDAR=GREGORIAN'))
tablespace SYSTEM
pctfree 10
pctused 40
initrans 1
maxtrans 255
storage
(
initial 64K
next 1M
minextents 1
maxextents unlimited
)
);
-- Create/Recreate primary, unique and foreign key constraints
alter table SYS_LOG
add constraint PID primary key (PID)
using index
tablespace SYSTEM
pctfree 10
initrans 2
maxtrans 255
storage
(
initial 64K
next 1M
minextents 1
maxextents unlimited
);
11g分区表按时间自动建立(Interval Partitioning) 我这个用到了oracle 11G的新特性
INTERVAL分区
这个实际上是范围分区的加强功能,经过这个功能能够实如今须要的时候自动的实现新的分区的添加,从而省去了你不断的ADD或者SPLIT新的分区。
若是是9i的话 必须把分区的日期写死 根据你的表里的日志值,由于日志表在实时增长数据,你还得按期去手动新建 新的分区,好比这样alter table sys_log_tem add PARTITION logtime values less than('2012-06-01 00:00:00') tablespace system;.....
分区后日志查询速度快的不是通常多啊 !!