Oracle数据行拆分多行

时间 2019-11-08

标签 oracle 数据拆分栏目 Oracle 繁體版

原文原文链接

单行拆分

若是表数据只有一行，则能够直接在原表上直接使用connect by+正则的方法,好比：sql

select regexp_substr('444.555.666', '[^.]+', 1, level) col dom

from dual 函数

connect by level <= regexp_count('444.555.666', '\.') + 1 大数据

输出结果：spa

多行拆分

若是数据表存在多行数据须要拆分，也能够在原表上使用connect+正则的方法：regexp

方法1、ci

with t asinput

(select '111.222.333' col it

from dual io

union all

select '444.555.666' col

from dual)

select regexp_substr(col, '[^.]+', 1, level)

from t

connect by level <= regexp_count(col, '\.\') + 1

and col = prior col

and prior dbms_random.value > 0

结果：

方法2、使用构造的最大行数值关联原表：

with t as

(select '111.222.333' col

from dual

union all

select '444.555.666' col

from dual)

select regexp_substr(col, '[^.]+', 1, lv)

from t, (select level lv from dual connect by level < 10) b

where b.lv <= regexp_count(t.col, '\.\') + 1

这种方法设置第二个数据集的时候要小于可能的最大值，而后两数据集作关联，在作大数据量拆分的时候，这个数值设置得当，拆分行数相对一致的状况下，效率比方法一直接connect by要高。

方法3、使用table函数：

with t as

(select '111.222.333' col

from dual

union all

select '444.555.666' col

from dual)

select column_value

from t,

table(cast(multiset

(select regexp_substr(col, '[^.]+', 1, level) dd

from dual

connect by level <= regexp_count(t.col, '\.\') + 1) as

sys.odcivarchar2list)) a

结果：

这个方法输出的列名是固定的，column_value依赖于sys.odcivarchar2list这个类型的输出，该方法对于大数据量的拆分效率比第二个方法好。

另外需注意，大数据量的拆分时，谨慎使用正则的方法去作，能够使用substr+instr的方式替换正则。

若是以上方法的效率仍然不理想，可考虑使用plsql块。