若是表数据只有一行,则能够直接在原表上直接使用connect by+正则的方法,好比:sql
select regexp_substr('444.555.666', '[^.]+', 1, level) col dom
from dual 函数
connect by level <= regexp_count('444.555.666', '\.') + 1 大数据
输出结果:spa
若是数据表存在多行数据须要拆分,也能够在原表上使用connect+正则的方法:regexp
方法1、ci
with t asinput
(select '111.222.333' col it
from dual io
union all
select '444.555.666' col
from dual)
select regexp_substr(col, '[^.]+', 1, level)
from t
connect by level <= regexp_count(col, '\.\') + 1
and col = prior col
and prior dbms_random.value > 0
结果:
方法2、使用构造的最大行数值关联原表:
with t as
(select '111.222.333' col
from dual
union all
select '444.555.666' col
from dual)
select regexp_substr(col, '[^.]+', 1, lv)
from t, (select level lv from dual connect by level < 10) b
where b.lv <= regexp_count(t.col, '\.\') + 1
这种方法设置第二个数据集的时候要小于可能的最大值,而后两数据集作关联,在作大数据量拆分的时候,这个数值设置得当,拆分行数相对一致的状况下,效率比方法一直接connect by要高。
方法3、使用table函数:
with t as
(select '111.222.333' col
from dual
union all
select '444.555.666' col
from dual)
select column_value
from t,
table(cast(multiset
(select regexp_substr(col, '[^.]+', 1, level) dd
from dual
connect by level <= regexp_count(t.col, '\.\') + 1) as
sys.odcivarchar2list)) a
结果:
这个方法输出的列名是固定的,column_value依赖于sys.odcivarchar2list这个类型的输出,该方法对于大数据量的拆分效率比第二个方法好。
另外需注意,大数据量的拆分时,谨慎使用正则的方法去作,能够使用substr+instr的方式替换正则。
若是以上方法的效率仍然不理想,可考虑使用plsql块。