Oracle 表分区算法
早在8.0.5版本中,Oracle就将范围分区技术引入,如今分区功能已经愈来愈强大,包括支持扩展分区功能、Interval分区、外键分区、模拟列分区、以及分区建议器等。那么,分区到底有什么好处呢?咱们为何要使用分区呢?在什么环境下使用分区比较合适呢?数据库
分区表应用在大表更合适,至少要大于100万条的记录才能够考虑使用分区表安全
1)因为Oracle数据库能够将分区指定为不一样的表空间,而不一样的表空间是能够指向不一样的磁盘设备的,优化物理硬件资源,缩短了执行的时间;安全性也获得了很大的提高。session
2)能够无视其余分区的数据,仅对本区的数据进行删除操做。oracle
3)提升了特定的查询速度。app
4)节约维护的成本,下降由于维护数据而对其余系统数据产生的各类影响。ide
范围分区将数据基于范围映射到每个分区,这个范围是你在建立分区时指定的分区键决定的。这种分区方式是最为经常使用的,而且分区键常常采用日期。函数
如何选择范围分区的依据从而可以让数据均匀分布,是一个须要重点关注的问题。测试
当使用范围分区时,请考虑如下几个规则:优化
一、每个分区都必须有一个VALUES LESS THAN子句,它指定了一个不包括在该分区中的上限值。分区键的任何值等于或者大于这个上限值的记录都会被加入到下一个高一些的分区中。
二、全部分区,除了第一个,都会有一个隐式的下限值,这个值就是此分区的前一个分区的上限值。
三、在最高的分区中,MAXVALUE被定义。MAXVALUE表明了一个不肯定的值。这个值高于其它分区中的任何分区键的值,也能够理解为高于任何分区中指定的VALUE LESS THAN的值,同时包括空值。
1)查看数据库表空间
select * from dba_tablespaces
2)建立表空间
create tablespace zj1
datafile 'D:\app\zWX214990\oradata\orcl\zj.dbf' size 50M
下面,咱们经过脚原本建立一个基于月份的范围分区表(假设插入的数据所有都是2013年的数据)
DROP TABLE PART_LOG_ZJ PURGE; --purge永久删除选项
(补充):对于误删的表,只要没有使用purge永久删除选项,那么从flash back区恢复回来但愿挺大的。通常步骤:
select * from recyclebin
flashback table tb to before drop
CREATE TABLE PART_LOG_ZJ(
LOG_ID NUMBER(20) PRIMARY KEY,
LOG_DATE DATE,
LOG_DESC VARCHAR2(20)
)
PARTITION BY RANGE(LOG_DATE)
(
PARTITION PART_LOG_01 VALUES LESS THAN (TO_DATE('2013-01-01','YYYY-MM-DD')) TABLESPACE zj1,
PARTITION PART_LOG_02 VALUES LESS THAN (TO_DATE('2013-03-01','YYYY-MM-DD')) TABLESPACE zj1,
PARTITION PART_LOG_03 VALUES LESS THAN (TO_DATE('2013-05-01','YYYY-MM-DD')) TABLESPACE zj1,
PARTITION PART_LOG_04 VALUES LESS THAN (TO_DATE('2013-07-01','YYYY-MM-DD')) TABLESPACE zj1,
PARTITION PART_LOG_05 VALUES LESS THAN (TO_DATE('2013-09-01','YYYY-MM-DD')) TABLESPACE zj1,
PARTITION PART_LOG_06 VALUES LESS THAN (TO_DATE('2013-10-01','YYYY-MM-DD')) TABLESPACE zj1,
PARTITION PART_LOG_07 VALUES LESS THAN (MAXVALUE) TABLESPACE zj1
);
经过PARTITION BY RANGE关键字来指出进行分区的策略,其中PARTITION BY LOG(LOG_DATE)指的是使用LOG_DATE来做为分区的字段,里面根据取值的大小,命名了7个分区来存放数据,每一个分区还能够指定不一样的表空间,第七个分区使用MAXVALUE来避免有数值没有被上面的范围圈定,这个就相似于SWITCH语法中的DEFAULT,不一样的,这个并非fall through的。
下面,咱们来生成10万条数据来插入到表中,查看一下表中发生了什么样子的变化?
INSERT INTO PART_LOG_ZJ
(LOG_ID, LOG_DATE, LOG_DESC)
SELECT LEVEL,
TO_DATE('2013-01-01', 'YYYY-MM-DD') +
NUMTODSINTERVAL(CEIL(DBMS_RANDOM.VALUE(0, 365)), 'DAY'),
LEVEL || 'DESC'
FROM DUAL
CONNECT BY LEVEL <= 100000;
首先,咱们能够查询一下落在七、8月份的日志记录,就如同咱们去新华书店只是去查找IT类的书籍同样,咱们知道咱们应当去那里寻找名字为PART_LOG_05分区的数据:
SELECT COUNT(1) FROM PART_LOG_ZJ PARTITION (PART_LOG_05);
显示结果:
经过上面的结果能够很明显的看出,有17030条数据落在了七、8月份的分区中。咱们经过指定分区,将所有的注意力只放到此1.7W条左右的数据而不是所有的10W条数据上,能够很明显带来效能的提高。
咱们如何才能知道正确的分区呢?
Oracle数据库也提供了这个指引牌,那就是下面两个数据字典:DBA_PART_TABLES和DBA_TAB_PARTITIONS
SELECT T.OWNER AS "全部者",
T.TABLE_NAME AS "表名",
T.PARTITIONING_TYPE AS "分区类型",
T.SUBPARTITIONING_TYPE AS "子分区类型",
T.PARTITION_COUNT AS "子分区数量",
T.PARTITIONING_KEY_COUNT AS "分区键中列的数量",
T.SUBPARTITIONING_KEY_COUNT AS "子分区键中列的数量",
T.STATUS AS "分区表状态",
T.DEF_TABLESPACE_NAME AS "默认表空间"
FROM DBA_PART_TABLES T
WHERE T.TABLE_NAME IN ('PART_LOG_ZJ');
经过上面咱们能够看到,表PART_LOG_CHENZW如今有7个分区,可是,咱们并不能知道这7个分区都是存放什么样子的数据的?咱们到什么地方去找到咱们但愿的七、8月的数据呢?
SELECT T.TABLE_OWNER AS "全部者",
T.TABLE_NAME AS "表名",
T.COMPOSITE AS "是否组合分区",
T.PARTITION_NAME AS "分区名",
T.SUBPARTITION_COUNT AS "子分区数",
T.HIGH_VALUE AS "分区上限",
T.HIGH_VALUE_LENGTH AS "分区上限长度",
T.PARTITION_POSITION AS "分区在表中位置",
T.TABLESPACE_NAME AS "所在表空间"
FROM DBA_TAB_PARTITIONS T
WHERE T.TABLE_NAME IN ('PART_LOG_ZJ')
从上面的结果能够看到,若是咱们但愿找到七、8月份的数据,就能够根据分区上限定位到PART_LOG_05分区。
最后,咱们能够经过查询数据字典USER_SEGMENTS来查看分区表占用的磁盘空间信息,以下:
SELECT T.SEGMENT_NAME AS "段名",
T.PARTITION_NAME AS "分区名",
T.SEGMENT_TYPE AS "分区类型",
T.BYTES / POWER(1024, 2) || 'M' AS "分区大小",
T.TABLESPACE_NAME AS "表空间"
FROM USER_SEGMENTS T
WHERE T.SEGMENT_NAME IN ('PART_LOG_ZJ');
一般状况下,若是你的数据中的某一项是能够被枚举的,那么,此列就能够用做列表分区的分区字段。
CREATE TABLE PART_BOOK_ZJ(
BOOK_ID NUMBER(20) PRIMARY KEY,
BOOK_DATE DATE,
BOOK_TYPE NUMBER(2) NOT NULL,
BOOK_DESC VARCHAR2(20)
)
PARTITION BY LIST(BOOK_TYPE)
(
PARTITION PART_BOOK_01 VALUES(0) TABLESPACE zj1,
PARTITION PART_BOOK_02 VALUES(1) TABLESPACE zj1,
PARTITION PART_BOOK_03 VALUES(2) TABLESPACE zj1,
PARTITION PART_BOOK_04 VALUES(3) TABLESPACE zj1
);
下面的脚本用于生成相应的数据:
INSERT INTO PART_BOOK_ZJ
(BOOK_ID, BOOK_DATE, BOOK_TYPE,BOOK_DESC)
SELECT LEVEL,
TO_DATE('2013-01-01', 'YYYY-MM-DD') +
NUMTODSINTERVAL(CEIL(DBMS_RANDOM.VALUE(0, 365)), 'DAY'),
MOD(LEVEL,4),
LEVEL || 'DESC'
FROM DUAL
CONNECT BY LEVEL <= 100000;
注:操做同上
这类分区是在列值上使用散列算法,以肯定将行放入哪一个分区中。当列的值没有合适的条件时,建议使用散列分区。
散列分区为经过指定分区编号来均匀分布数据的一种分区类型,由于经过在I/O设备上进行散列分区,使得这些分区大小一致。
DROP TABLE PART_BOOK_ZJ PURGE;
CREATE TABLE PART_BOOK_ZJ(
BOOK_ID NUMBER(20) PRIMARY KEY,
BOOK_DATE DATE,
BOOK_TYPE NUMBER(2) NOT NULL,
BOOK_DESC VARCHAR2(20)
)
PARTITION BY HASH(BOOK_ID)
(
PARTITION PART_BOOK_01 TABLESPACE zj1,
PARTITION PART_BOOK_02 TABLESPACE zj1,
PARTITION PART_BOOK_03 TABLESPACE zj1,
PARTITION PART_BOOK_04 TABLESPACE zj1
);
INSERT INTO PART_BOOK_ZJ
(BOOK_ID, BOOK_DATE, BOOK_TYPE,BOOK_DESC)
SELECT LEVEL,
TO_DATE('2013-01-01', 'YYYY-MM-DD') +
NUMTODSINTERVAL(CEIL(DBMS_RANDOM.VALUE(0, 365)), 'DAY'),
MOD(LEVEL,4),
LEVEL || 'DESC'
FROM DUAL
CONNECT BY LEVEL <= 100000;
hash分区最主要的机制是根据hash算法来计算具体某条纪录应该插入到哪一个分区中,hash算法中最重要的是hash函数,Oracle中若是你要使用hash分区,只需指定分区的数量便可。建议分区的数量采用2的n次方,这样可使得各个分区间数据分布更加均匀。
这种分区是基于范围分区和列表分区,表首先按某列进行范围分区,而后再按某列进行列表分区,分区之中的分区被称为子分区。
/*组合分区*/
--删除测试表
DROP TABLE PART_BOOK_ZJ PURGE;
--建立列表-范围组合分区
CREATE TABLE PART_BOOK_ZJ(
BOOK_ID NUMBER(20) PRIMARY KEY,
BOOK_DATE DATE,
BOOK_TYPE NUMBER(2) NOT NULL,
BOOK_DESC VARCHAR2(20)
)
PARTITION BY LIST(BOOK_TYPE)
SUBPARTITION BY RANGE(BOOK_DATE)
SUBPARTITION TEMPLATE
(
SUBPARTITION PART_LOG_01 VALUES LESS THAN (TO_DATE('2013-01-01','YYYY-MM-DD')) TABLESPACE zj1,
SUBPARTITION PART_LOG_02 VALUES LESS THAN (TO_DATE('2013-03-01','YYYY-MM-DD')) TABLESPACE zj1,
SUBPARTITION PART_LOG_03 VALUES LESS THAN (TO_DATE('2013-05-01','YYYY-MM-DD')) TABLESPACE zj1,
SUBPARTITION PART_LOG_04 VALUES LESS THAN (TO_DATE('2013-07-01','YYYY-MM-DD')) TABLESPACE zj1,
SUBPARTITION PART_LOG_05 VALUES LESS THAN (TO_DATE('2013-09-01','YYYY-MM-DD')) TABLESPACE zj1,
SUBPARTITION PART_LOG_06 VALUES LESS THAN (TO_DATE('2013-10-01','YYYY-MM-DD')) TABLESPACE zj1,
SUBPARTITION PART_LOG_07 VALUES LESS THAN (MAXVALUE) TABLESPACE zj1
)
(
PARTITION PART_BOOK_01 VALUES(0) TABLESPACE zj1,
PARTITION PART_BOOK_02 VALUES(1) TABLESPACE zj1,
PARTITION PART_BOOK_03 VALUES(2) TABLESPACE zj1,
PARTITION PART_BOOK_04 VALUES(3) TABLESPACE zj1
);
--生成测试数据
INSERT INTO PART_BOOK_ZJ
(BOOK_ID, BOOK_DATE, BOOK_TYPE,BOOK_DESC)
SELECT LEVEL,
TO_DATE('2013-01-01', 'YYYY-MM-DD') +
NUMTODSINTERVAL(CEIL(DBMS_RANDOM.VALUE(0, 365)), 'DAY'),
MOD(LEVEL,4),
LEVEL || 'DESC'
FROM DUAL
CONNECT BY LEVEL <= 100000;
这种分区是基于范围分区和散列分区,表首先按某列进行范围分区,而后再按某列进行散列分区。
如下代码给PART_BOOK_ZJ表添加了一个PART_BOOK_05分区
--添加列表分区
ALTER TABLE PART_BOOK_ZJ ADD PARTITION PART_BOOK_05 VALUES(4) TABLESPACE zj1;
--添加范围分区
ALTER TABLE PART_LOG_ZJ ADD PARTITION P3 VALUES LESS THAN (TO_DATE('2003-06-01','YYYY-MM-DD')) TABLESPACE zj1;
注意:增长一个分区的时候,增长的分区的条件必须大于现有分区的最大值,不然系统将提示ORA-14074 partition bound must collate higher than that of the last partition 错误。
如下代码删除了PART_BOOK_ZJ表中名为PART_BOOK_05的分区:
ALTER TABLE PART_BOOK_ZJ DROP PARTITION PART_BOOK_05;
注意:若是删除的分区是表中惟一的分区,那么此分区将不能被删除,要想删除此分区,必须删除表。
截断某个分区是指删除某个分区中的数据,并不会删除分区,也不会删除其它分区中的数据。当表中即便只有一个分区时,也能够截断该分区。经过如下代码截断分区:
ALTER TABLE PART_LOG_ZJ TRUNCATE PARTITION PART_LOG_01;
SELECT COUNT(1) FROM PART_LOG_ZJ PARTITION (PART_LOG_01);
合并分区是将相邻的分区合并成一个分区,结果分区将采用较高分区的界限,值得注意的是,不能将分区合并到界限较低的分区。如下代码实现了PART_LOG_02, PART_LOG_03分区的合并:
ALTER TABLE PART_LOG_ZJ MERGE PARTITIONS PART_LOG_02, PART_LOG_03 INTO PARTITION PART_LOG_03;
注:1.PART_LOG_02, PART_LOG_03 合并到 PART_LOG_02
2. PART_LOG_03 ,PART_LOG_02 合并到 PART_LOG_03
拆分分区将一个分区拆分两个新分区,拆分后原来分区再也不存在可是若是表存在PMAX分区那么原来的分区仍是能够存在的。注意不能对 HASH类型的分区进行拆分。
ALTER TABLE PART_LOG_ZJ split PARTITION PART_LOG_03
AT (TO_DATE('2013-03-01','YYYY-MM-DD')) INTO (PARTITION PART_LOG_02,PARTITION PART_LOG_03);
接合分区是将散列分区中的数据接合到其它分区中,当散列分区中的数据比较大时,能够增长散列分区,而后进行接合,值得注意的是,接合分区只能用于散列分区中。经过如下代码进行接合分区:
ALTER TABLE PART_BOOK_ZJ coalesce PARTITION;
如下代码将PART_BOOK_01更改成PART_BOOK_1
ALTER TABLE PART_BOOK_ZJ RENAME PARTITION PART_BOOK_01 TO PART_BOOK_1
alter table PART_BOOK_ZJ move Partition PART_BOOK_02
tablespace USERS nologging
select sum(cn) from
(select count(*) cn from PART_BOOK_ZJ PARTITION (PART_BOOK_1)
union all
select count(*) cn from PART_BOOK_ZJ PARTITION (PART_BOOK_02));
统计PART_BOOK_一、PART_BOOK_02上总共多少条数据
SELECT * FROM user_tab_partitions WHERE TABLE_NAME='PART_BOOK_ZJ'
select object_name,object_type,tablespace_name,sum(value)
from v$segment_statistics
where statistic_name IN ('physical reads','physical write','logical reads')and object_type='INDEX'
group by object_name,object_type,tablespace_name
order by 4 desc
SELECT COUNT(1) FROM PART_LOG_ZJ PARTITION (PART_LOG_01);
--显示数据库全部分区表的信息:
select * from DBA_PART_TABLES
--显示当前用户可访问的全部分区表信息:
select * from ALL_PART_TABLES
--显示当前用户全部分区表的信息:
select * from USER_PART_TABLES
--显示表分区信息 显示数据库全部分区表的详细分区信息:
select * from DBA_TAB_PARTITIONS
--显示当前用户可访问的全部分区表的详细分区信息:
select * from ALL_TAB_PARTITIONS
--显示当前用户全部分区表的详细分区信息:
select * from USER_TAB_PARTITIONS
--显示子分区信息 显示数据库全部组合分区表的子分区信息:
select * from DBA_TAB_SUBPARTITIONS
--显示当前用户可访问的全部组合分区表的子分区信息:
select * from ALL_TAB_SUBPARTITIONS
--显示当前用户全部组合分区表的子分区信息:
select * from USER_TAB_SUBPARTITIONS
--显示分区列 显示数据库全部分区表的分区列信息:
select * from DBA_PART_KEY_COLUMNS
--显示当前用户可访问的全部分区表的分区列信息:
select * from ALL_PART_KEY_COLUMNS
--显示当前用户全部分区表的分区列信息:
select * from USER_PART_KEY_COLUMNS
--显示子分区列 显示数据库全部分区表的子分区列信息:
select * from DBA_SUBPART_KEY_COLUMNS
--显示当前用户可访问的全部分区表的子分区列信息:
select * from ALL_SUBPART_KEY_COLUMNS
--显示当前用户全部分区表的子分区列信息:
select * from USER_SUBPART_KEY_COLUMNS
--怎样查询出oracle数据库中全部的的分区表
select * from user_tables a where a.partitioned='YES'
--删除一个表的数据是
truncate table table_name;
--删除分区表一个分区的数据是
alter table table_name truncate partition p5;
注意,在维护分区的时候可能会对索引产生必定的影响,会引发分区表的全局索引无效,须要重建索引。
对分区表作了维护操做后,必须检查相关索引,如检查hisdeliverx表的非分区索引:
select owner,index_name,status from dba_indexes where table_name='HISDELIVERX';
如有索引的状态为unusable,则必须使用alter index index_name rebuild online;重建该索引。
通常建议在拆分分区、truncate 分区中的数据、删除分区等功做时最好在语句后面加上update indexes子句,
这样索引为unusable状态的可能性就会很低,以下语句:
ALTER TABLE table_name SPLIT PARTITION partition_name1 AT(20000) INTO (
partition partition_name2,partition partition_name3) update indexes;
alter table table_name truncate partition partition_name update indexes;
alter table table_name drop partition partition_name update indexes;
使用exchange partition方法
假设把hisdeliverx由非分区表改成分区表。
基本思路:hisdeliverx是(数据量上百万条,列比较多)一个非分区表,此时建立一 个与hisdeliverx同结构的分区表t_hisdeliverx,交换和维护数据,删除hisdeliverx表,将t_hisdeliverx更 名为hisdeliverx。而后再重建hisdeliverx表上的索引。
--具体步骤:
--建立分区表(结构和非分区表hisdeliverx相同)
create table t_HISDELIVERX
(
INIT_DATE NUMBER(10) default to_number(to_char(sysdate,'yyyymmdd')) not null,
SERIAL_NO NUMBER(10) default 0 not null,
……
……
---交换数据(数据从非分区表到分区表)
SQL> alter table t_hisdeliverx exchange partition pmax with table hisdeliverx;
Table altered
SQL> drop table hisdeliverx;
---删除非分区表
Table dropped
---将分区表重命名为原非分区表名
SQL> alter table t_hisdeliverx rename to hisdeliverx;
Table altered
---检查hideliverx表是否为分区表
select table_owner,table_name,partition_name from dba_tab_partitions a where a.table_owner='HS_HIS' and
a.table_name='HISDELIVERX';
注意,在作exchange partition操做前先对该表进行备份
select * from dba_tablespaces
DROP TABLESPACE zj1 INCLUDING CONTENTS AND DATAFILES CASCADE CONSTRAINTS;
select TABLE_NAME,PARTITIONING_TYPE,SUBPARTITIONING_TYPE,STATUS
from user_part_tables;
select TABLE_NAME,PARTITION_NAME,TABLESPACE_NAME
from user_tab_partitions
通常步骤:
1.从flash back里查询被删的表
select * from recyclebin
2.执行表的恢复
flashback table tb to before drop
解决:这个表正在使用,lock
select * from v$session;
select * from v$locked_object;
exp zj/zj@orcl buffer=102400 tables=PART_BOOK_ZJ:PART_BOOK_02,file=D:\exp_dxsq_tables.dmp log=D:\exp_dxsq_tables.log