此文从如下几个方面来整理关于分区表的概念及操做:算法
1.表空间及分区表的概念数据库
2.表分区的具体做用oracle
3.表分区的优缺点less
4.表分区的几种类型及操做方法ide
5.对表分区的维护性操做.函数
6.表的分区作过改变后索引问题工具
7.将一个非分区表转换为分区表性能
表空间: 是一个或多个数据文件的集合,全部的数据对象都存放在指定的表空间中,但主要存放的是表, 因此称做表空间。spa
分区表: 当表中的数据量不断增大,查询数据的速度就会变慢,应用程序的性能就会降低,这时就应该考虑对表进行分区。表进行分区后,逻辑上表仍然是一张完整的表,只是将表中的数据在物理上存放到多个“表空间”(物理文件上),这样查询数据时,不至于每次都扫描整张表而只是从当前的分区查到所要的数据大大提升了数据查询的速度。
Oracle的表分区功能经过改善可管理性、性能和可用性,从而为各式应用程序带来了极大的好处。一般,分区可使某些查询以及维护操做的性能大大提升。此外,分区还能够极大简化常见的管理任务,分区是构建千兆字节数据系统或超高可用性系统的关键工具。 分区功能可以将表、索引或索引组织表进一步细分为段,这些数据库对象的段叫作分区。每一个分区有本身的名称,还能够选择本身的存储特性。从数据库管理员的角度来看,一个分区后的对象具备多个段,这些段既可进行集体管理,也可单独管理,这就使数据库管理员在管理分区后的对象时有至关大的灵活性。可是,从应用程序的角度来看,分区后的表与非分区表彻底相同,使用 SQL DML 命令访问分区后的表时,无需任何修改。
何时使用分区表: 一、表的大小超过2GB。
二、表中包含历史数据,新的数据被增长到新的分区中。
表分区有如下优势: 一、改善查询性能:对分区对象的查询能够仅搜索本身关心的分区,提升检索速度。
二、加强可用性:若是表的某个分区出现故障,表在其余分区的数据仍然可用;
三、维护方便:若是表的某个分区出现故障,须要修复数据,只修复该分区便可;
四、均衡I/O:能够把不一样的分区映射到不一样磁盘以平衡I/O,改善整个系统性能。
缺点: 分区表相关:已经存在的表没有方法能够直接转化为分区表。不过 Oracle 提供了在线重定义表的功能。
一.范围分区: 范围分区将数据基于范围映射到每个分区,这个范围是你在建立分区时指定的分区键决定的。这种分区方式是最为经常使用的,而且分区键常常采用日期。举个例子:你可能会将销售数据按照月份进行分区。
当使用范围分区时,请考虑如下几个规则:
一、每个分区都必须有一个VALUES LESS THAN子句,它指定了一个不包括在该分区中的上限值。分区键的任何值等于或者大于这个上限值的记录都会被加入到下一个高一些的分区中。
二、全部分区,除了第一个,都会有一个隐式的下限值,这个值就是此分区的前一个分区的上限值。
三、在最高的分区中,MAXVALUE被定义。MAXVALUE表明了一个不肯定的值。这个值高于其它分区中的任何分区键的值,也能够理解为高于任何分区中指定的VALUE LESS THAN的值,同时包括空值。
例一:
假设有一个CUSTOMER表,表中有数据200000行,咱们将此表经过CUSTOMER_ID进行分区,每一个分区存储100000行,咱们将每一个分区保存到单独的表空间中,这样数据文件就能够跨越多个物理磁盘。下面是建立表和分区的代码,以下:
CREATE TABLE CUSTOMER ( CUSTOMER_ID NUMBER NOT NULL PRIMARY KEY, FIRST_NAME VARCHAR2(30) NOT NULL, LAST_NAME VARCHAR2(30) NOT NULL, PHONE VARCHAR2(15) NOT NULL, |
例二:按时间划分
CREATE TABLE ORDER_ACTIVITIES ( ORDER_ID NUMBER(7) NOT NULL, ORDER_DATE DATE, TOTAL_AMOUNT NUMBER, CUSTOTMER_ID NUMBER(7), PAID CHAR(1) ) PARTITION BY RANGE (ORDER_DATE) ( PARTITION ORD_ACT_PART01 VALUES LESS THAN (TO_DATE('01- MAY -2003','DD-MON-YYYY')) TABLESPACEORD_TS01, PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUN-2003','DD-MON-YYYY')) TABLESPACE ORD_TS02, PARTITION ORD_ACT_PART02 VALUES LESS THAN (TO_DATE('01-JUL-2003','DD-MON-YYYY')) TABLESPACE ORD_TS03 ) |
例三:MAXVALUE
CREATE TABLE RangeTable ( idd INT PRIMARY KEY , iNAME VARCHAR(10), grade INT ) PARTITION BY RANGE (grade) ( PARTITION part1 VALUES LESS THAN (1000) TABLESPACE Part1_tb, PARTITION part2 VALUES LESS THAN (MAXVALUE) TABLESPACE Part2_tb ); |
该分区的特色是某列的值只有几个,基于这样的特色咱们能够采用列表分区。
例一
CREATE TABLE PROBLEM_TICKETS ( PROBLEM_ID NUMBER(7) NOT NULL PRIMARY KEY, DESCRIPTION VARCHAR2(2000), CUSTOMER_ID NUMBER(7) NOT NULL, DATE_ENTERED DATE NOT NULL, STATUS VARCHAR2(20) ) PARTITION BY LIST (STATUS) ( PARTITION PROB_ACTIVE VALUES ('ACTIVE') TABLESPACE PROB_TS01, PARTITION PROB_INACTIVE VALUES ('INACTIVE') TABLESPACE PROB_TS02) |
例二
CREATE TABLE ListTable ( id INT PRIMARY KEY , name VARCHAR (20), area VARCHAR (10) ) |
三.散列分区(也称HASH分区): 这类分区是在列值上使用散列算法,以肯定将行放入哪一个分区中。当列的值没有合适的条件时,建议使用散列分区。
散列分区为经过指定分区编号来均匀分布数据的一种分区类型,由于经过在I/O设备上进行散列分区,使得这些分区大小一致。
例一:
CREATE TABLE HASH_TABLE ( COL NUMBER(8), |
简写:
CREATE TABLE emp ( empno NUMBER (4), ename VARCHAR2 (30), sal NUMBER ) PARTITION BY HASH (empno) PARTITIONS 8 STORE IN (tbs01,tbs02,tbs03,tbs04,tbs05,tbs06,tbs07,tbs08); |
hash分区最主要的机制是根据hash算法来计算具体某条纪录应该插入到哪一个分区中,hash算法中最重要的是hash函数,Oracle中若是你要使用hash分区,只需指定分区的数量便可。建议分区的数量采用2的n次方,这样可使得各个分区间数据分布更加均匀。
四.组合范围列表分区 这种分区是基于范围分区和列表分区,表首先按某列进行范围分区,而后再按某列进行列表分区,分区之中的分区被称为子分区。
CREATE TABLE SALES ( PRODUCT_ID VARCHAR2(5), SALES_DATE DATE, SALES_COST NUMBER(10), STATUS VARCHAR2(20) ) PARTITION BY RANGE(SALES_DATE) SUBPARTITION BY LIST (STATUS) ( PARTITION P1 VALUES LESS THAN(TO_DATE('2003-01-01','YYYY-MM-DD'))TABLESPACE rptfact2009 ( |
这种分区是基于范围分区和散列分区,表首先按某列进行范围分区,而后再按某列进行散列分区。
create table dinya_test ( transaction_id number primary key, item_id number(8) not null, item_description varchar2(300), transaction_date date ) partition by range(transaction_date)subpartition by hash(transaction_id) subpartitions 3 store in (dinya_space01,dinya_space02,dinya_space03) ( partition part_01 values less than(to_date(‘2006-01-01’,’yyyy-mm-dd’)), partition part_02 values less than(to_date(‘2010-01-01’,’yyyy-mm-dd’)), partition part_03 values less than(maxvalue) ); |
(5).有关表分区的一些维护性操做: 1、添加分区 如下代码给SALES表添加了一个P3分区
ALTER TABLE SALES ADD PARTITION P3 VALUES LESS THAN (TO_DATE('2003-06-01','YYYY-MM-DD')) TABLESPACE SPACE_NAME; |
注意:增长一个分区的时候,增长的分区的条件必须大于现有分区的最大值,不然系统将提示ORA-14074 partition bound must collate higher than that of the last partition 错误。
如下代码给SALES表的P3分区添加了一个P3SUB1子分区
ALTER TABLE SALES MODIFY PARTITION P3 ADD SUBPARTITION P3SUB1 VALUES('COMPLETE') TABLESPACE SPACE_NAME; |
ALTER TABLE SALES DROP PARTITION P3; |
在如下代码删除了P4SUB1子分区:
ALTER TABLE SALES DROP SUBPARTITION P4SUB1; |
注意:若是删除的分区是表中惟一的分区,那么此分区将不能被删除,要想删除此分区,必须删除表。
3、截断分区
截断某个分区是指删除某个分区中的数据,并不会删除分区,也不会删除其它分区中的数据。当表中即便只有一个分区时,也能够截断该分区。经过如下代码截断分区:
ALTER TABLE SALES TRUNCATE PARTITION P2; |
经过如下代码截断子分区:
ALTER TABLE SALES TRUNCATE SUBPARTITION P2SUB2; |
4、合并分区 合并分区是将相邻的分区合并成一个分区,结果分区将采用较高分区的界限,值得注意的是,不能将分区合并到界限较低的分区。如下代码实现了P1 P2分区的合并:
ALTER TABLE SALES MERGE PARTITIONS P1, P2 INTO PARTITION P2; |
5、拆分分区 拆分分区将一个分区拆分两个新分区,拆分后原来分区再也不存在可是若是表存在PMAX分区那么原来的分区仍是能够存在的。注意不能对 HASH类型的分区进行拆分。
ALTER TABLE SALES SBLIT PARTITION P2 AT(TO_DATE('2003-02-01','YYYY-MM-DD')) INTO (PARTITION P21,PARTITION P22); 此拆分语句是将P2分区拆分为PARTITION P21与PARTITION P22两个分区,日期小于2003-02-01的数据存于 P21分区中不然存于 P22分区中。
--包含PMAX分区的表拆分分区 ALTER TABLE hs_his.HISHOLDSINFO SPLIT PARTITION PMAX AT(20100900) INTO (partition P201008, partition PMAX); 此拆分语句是将 PMAX 分区拆分为P201008与 PMAX 两个分区,数据小于20100900 的数据存于 P201008 分区中不然存于 PMAX 分区中。 |
6、接合分区(coalesca) 结合分区是将散列分区中的数据接合到其它分区中,当散列分区中的数据比较大时,能够增长散列分区,而后进行接合,值得注意的是,接合分区只能用于散列分区中。经过如下代码进行接合分区:
ALTER TABLE SALES COALESCA PARTITION; |
ALTER TABLE SALES RENAME PARTITION P21 TO P2; |
select sum( *) from (select count(*) cn from t_table_SS PARTITION (P200709_1) union all select count(*) cn from t_table_SS PARTITION (P200709_2) ); |
查询表上有多少分区
SELECT * FROM useR_TAB_PARTITIONS WHERE TABLE_NAME='tableName' |
查询索引信息
select object_name,object_type,tablespace_name,sum(value) from v$segment_statistics where statistic_name IN ('physical reads','physical write','logical reads')and object_type='INDEX' group by object_name,object_type,tablespace_name order by 4 desc |
--显示数据库全部分区表的信息:
select * from DBA_PART_TABLES
--显示当前用户可访问的全部分区表信息:
select * from ALL_PART_TABLES
--显示当前用户全部分区表的信息:
select * from USER_PART_TABLES
--显示表分区信息 显示数据库全部分区表的详细分区信息:
select * from DBA_TAB_PARTITIONS
--显示当前用户可访问的全部分区表的详细分区信息:
select * from ALL_TAB_PARTITIONS
--显示当前用户全部分区表的详细分区信息:
select * from USER_TAB_PARTITIONS
--显示子分区信息 显示数据库全部组合分区表的子分区信息:
select * from DBA_TAB_SUBPARTITIONS
--显示当前用户可访问的全部组合分区表的子分区信息:
select * from ALL_TAB_SUBPARTITIONS
--显示当前用户全部组合分区表的子分区信息:
select * from USER_TAB_SUBPARTITIONS
--显示分区列 显示数据库全部分区表的分区列信息:
select * from DBA_PART_KEY_COLUMNS
--显示当前用户可访问的全部分区表的分区列信息:
select * from ALL_PART_KEY_COLUMNS
--显示当前用户全部分区表的分区列信息:
select * from USER_PART_KEY_COLUMNS
--显示子分区列 显示数据库全部分区表的子分区列信息:
select * from DBA_SUBPART_KEY_COLUMNS
--显示当前用户可访问的全部分区表的子分区列信息:
select * from ALL_SUBPART_KEY_COLUMNS
--显示当前用户全部分区表的子分区列信息:
select * from USER_SUBPART_KEY_COLUMNS
--怎样查询出oracle数据库中全部的的分区表
select * from user_tables a where a.partitioned='YES'
--删除一个表的数据是
truncate table table_name;
--删除分区表一个分区的数据是
alter table table_name truncate partition p5;
6.表的分区作过改变后索引问题
注意,在维护分区的时候可能会对索引产生必定的影响,会引发分区表的全局索引无效,须要重建索引。
对分区表作了维护操做后,必须检查相关索引,如检查hisdeliverx表的非分区索引:
select owner,index_name,status from dba_indexes where table_name='HISDELIVERX';
如有索引的状态为unusable,则必须使用alter index index_name rebuild online;重建该索引。
通常建议在拆分分区、truncate 分区中的数据、删除分区等功做时最好在语句后面加上update indexes子句,
这样索引为unusable状态的可能性就会很低,以下语句:
ALTER TABLE table_name SPLIT PARTITION partition_name1 AT(20000) INTO (
partition partition_name2,partition partition_name3) update indexes;
alter table table_name truncate partition partition_name update indexes;
alter table table_name drop partition partition_name update indexes;
7.将一个非分区表转换为分区表
使用exchange partition方法
假设把hisdeliverx由非分区表改成分区表。
基本思路:hisdeliverx是(数据量上百万条,列比较多)一个非分区表,此时建立一个与hisdeliverx同结构的分区表t_hisdeliverx,交换和维护数据,删除hisdeliverx表,将t_hisdeliverx改名为hisdeliverx。而后再重建hisdeliverx表上的索引。
--具体步骤:
--建立分区表(结构和非分区表hisdeliverx相同)
create table t_HISDELIVERX
(
INIT_DATE NUMBER(10) default to_number(to_char(sysdate,'yyyymmdd')) not null,
SERIAL_NO NUMBER(10) default 0 not null,
……
……
---交换数据(数据从非分区表到分区表)
SQL> alter table t_hisdeliverx exchange partition pmax with table hisdeliverx;
Table altered
SQL> drop table hisdeliverx;
---删除非分区表
Table dropped
---将分区表重命名为原非分区表名
SQL> alter table t_hisdeliverx rename to hisdeliverx;
Table altered
---检查hideliverx表是否为分区表
select table_owner,table_name,partition_name from dba_tab_partitions a where a.table_owner='HS_HIS' and
a.table_name='HISDELIVERX';
注意,在作exchange partition操做前先对该表进行备份。