一、前提
首先须要对Oracle和PostgreSQL的SQL都比较熟悉。对其理解的越详细就越具备优点,本文帮助读者迅速理解这两类SQL的区别是什么。
若是因ACS/pg而须要将Oracle移植到PG,那么就须要熟悉AOLserver Tcl,尤为是SOLserver的API。本文,主要讨论:
Oracle 10g到11g(大多数能够适用到8i)
Oracle 12c某些方面会有不一样,可是迁移更加便捷
PostgreSQL 8.4,甚至适用更早版本。
二、事务
Oracle这个数据库会使用事务,那么PostgreSQL也须要激活事务。多个DML语句组成一个代码片断,而这些语句不会当即提交,那么就须要使用BEGIN语句开启一个事务,而后将这些语句包含在BEGIN这个块中。Oracle和PG中ROLLBACK和COMMIT、SAVEPOINT的语义相同。Oracle的隔离级别,PostgreSQL中也有。大多数状况下PG的隔离级别(读已提交)就已知足需求。
三、语法差别
PG中有少数语法不一样但功能相同SQL。ACS/pg会自动进行转换,只有大部分函数不一样,须要手工进行转换。这个工做由db_sql_prep来完成。
函数
Oracle有超过250个内置单行函数和不止50个聚合函数,详情查看:https://wiki.postgresql.org/wiki/Oracle_Functions。
Sysdate
Oracle使用sysdate函数获取当前日期和时间(以服务器的时区为准)。Postgres使用’now’::timestamp做为当前事务启动的日期和时间。ACS/pg将这个包装成sysdate()函数。
ACS/pg还包括Tcl过程,即db_sysdate。所以:
set now [database_to_tcl_string $db "select sysdate from dual"]
应该变成:
set now [database_to_tcl_string $db "select [db_sysdate] from dual"]
Dual表
Oracle的SELECT中实际不须要表名的地方可使用表DUAL,由于Oracle中的FROM子句是必须的。Postgsql中能够将FROM子句丢弃。能够在postgres中建立一个视图做为这个表从而消除上述问题。这样就能够在不干扰Postgres的解析器状况下兼容Oracle的SQL。迁移过程当中,尽量去掉“FROM DUAL”子句。由于和jual进行join比较奇怪。
ROWNUM和ROWID
Oracle的虚拟列ROWNUM:在执行ORDER BY前读取数据时分配一个数值。不少场景下可使用ROW_NUMBER() OVER(ORDER BY...)替代。可是使用序列进行模拟时可能会使性能慢些。
Oracle的虚拟列ROWID:表行的物理地址,以base64编码。应用中可使用该列临时缓存行地址,使第二次访问时更加便捷。Postgres的ctid起一样的做用。
序列
Oracle的序列语法是sequence_name.nextval。
Postgres的序列语法是nextval('sequence_name')。
Tcl中,获取写一个序列值能够抽象为调用[db_sequence_nextval $db sequence_name]。若是须要在一个复杂的SQL语句中使用序列值,可使用 [db_sequence_nextval_sql sequence_name]。
解码
Oracle的解码函数使用方法:decode(expr, search, result [, search, result...] [, default])
为了评估这个表达式,Oracle一个一个地比较expr和search值。若是expr等于search,Oracle返回对应的result。若是没有找到匹配值,返回default或者null。
Postgres没有这样的结构,可是可使用下面格式替代:
CASE WHEN expr THEN expr [...] ELSE expr END
例如:CASE WHEN c1 = 1 THEN 'match' ELSE 'no match' END,返回第一个为真的谓词对应的表达式。
DECODE和CASE的模拟方式有一点不一样:DECODE (x,NULL,'null','else'),若是x为NULL则返回NULL;而CASE x WHEN NULL THEN 'null' ELSE 'else' END,则返回’else’的result。Oracle一样。
NVL
Oracle还有其余便捷函数:NVL。若是不为NULL,NVL返回第一个参数,不然返回第二个参数:start_date := NVL(hire_date, SYSDATE);。若是hire_date为NULL,则前面的语句会返回SYSDATE。Postgres和Oracle有一个函数以更广泛的方式执行一样的行为: coalesce(expr1, expr2, expr3,....),返回第一个非NULL表达式。
FROM中子查询
Postgresql中子查询须要使用括号包含,并提供一个别名。Oracle中不须要别名:
Oracle: SELECT FROM (SELECT FROM table_a)
Postgresql: SELECT FROM (SELECT FROM table_a) AS foo
四、功能差别
Postgresql并不具有Oracle全部功能。ACS/pg经过指定的方案解决这些限制。虽然postgres具有大部分功能,可是一些特性还须要等待其新版本发布。
Outer joins
Oracle老版本9i以前,outer join:
SELECT a.field1, b.field2
FROM a, b
WHERE a.item_id = b.item_id(+)
(+)表示,若是表b中没有匹配的item_id值,匹配会继续下去,会做为一个空行进行匹配。Postgresql和Oracle 9i及以前版本:
SELECT a.field1, b.field2
FROM a
LEFT OUTER JOIN b
ON a.item_id = b.item_id;
只有汇聚值从outer joined表中提取时,也可能不使用join。若是原始查询:
SELECT a.field1, sum (b.field2)
FROM a, b
WHERE a.item_id = b.item_id (+)
GROUP BY a.field1
Postgres的查询:SELECT a.field1, b_sum_field2_by_item_id (a.item_id) FROM a,此时能够定义函数:
CREATE FUNCTION b_sum_field2_by_item_id (integer)
RETURNS integer
AS '
DECLARE
v_item_id alias for $1;
BEGIN
RETURN sum(field2) FROM b WHERE item_id = v_item_id;
END;
' language 'plpgsql';
Oracle 9i开始将支持SQL 99的 outer join语法。可是一些程序员仍然使用旧语法,因此这篇文章显得有意义。
CONNECT BY
Postgres不支持connect by语句。可使用WITH RECURSIVE替代。因为WITH RECURSIVE是图灵完毕的,所以很容易将CONNECT BY语句转换成WITH RECURSIVE。有时还能够将CONNECT BY当作一个简单的iterator:
SELECT ... FROM DUAL CONNECT BY rownum <=10
等价于:
SELECT ... FROM generate_series(...)
NO_DATA_FOUND and TOO_MANY_ROWS
默认状况下PL/pgsql禁止使用此异常。当须要在存储的PLpgSQL代码中进行单行检查时,须要在全部SELECT中的任何关键字INTO以后添加关键字STRICT。
五、数据类型
Postgres严格尊周SQL表中,而Oracle因为历史缘由,会有本身特有的方式,尤为是数据类型方面。
空字符串与NULL
Oracle中,strings()空和NULL在字符串内容中相同。能够将NULL和和一个字符串链接起来做为结果。可是在postgres中,这种状况获得的结果是NULL。Oracle中须要使用IS NULL操做符来检测字符串是否为空。Postgres中,对于空字符串获得的结果是FALSE,而NULL获得的是TRUE。当从Oracle向postgres转换时,须要分析字符代码,分离出NULL和空字符串。
Numeric类型
Oracle中常用NUMBER数据类型,PG中对应的数据类型时DECIMAL或者NUMERIC。PG中的numbers限制(小数点前到131072位,小数点后16383位)比Oracle高,内部存储方式相同。Oracle的FLOAT在PG中是REAL,DOUBLE是DOUBLE PRECISION。
Date and Time
Oracle中的DATE包含data和time。不少中状况下,使用PG中的TIMESTAMP就足够了。因为date只包含秒、分、小时、天、月和年,因此一些状况下不是精确的结果。没有几分钟、没有夏令时、没有时区。Oracle的TIMESTAMP和PG相似。
Oracle只有INTERVAL YEAR TO MONTH and INTERVAL DAY TO SECOND,所以PG能够直接使用。
CLOBs
PG以TEXT的形式对CLOB有不错的支持。
BLOBs
PG对二进制大对象支持很是差。由于不能使用pg_dump进行dump因此不适合在24/7环境中使用。利用大对象的数据库进行备份时,须要将数据库关闭,而后直接备份数据目录。
Don Baccus修改了SOLserver的PG驱动,经过编码/解码二进制文件,从而支持二进制大对象。数据库在运行时进行dump,这些结果对象能够用来保证一致性,从而在备份时不须要中断服务。
为了绕过PG对元组大小对于一个块的限制,驱动程序将编码的数据分红8K大小的块。PG将在2000年夏天对大对象进行大修。所以,只实现了ACS使用的BLOB功能。
为了使用BLOB驱动扩展,首先须要建立一个表,其lob列定义为interger类型,再建立一个触发器on_lob_ref。例如:
create table my_table (
my_key integer primary key,
lob integer references lobs,
my_other_data some_type -- etc
);
建立一个触发器my_table_lob_trig,在insert或delete或update前触发:
set lob [database_to_tcl_string $db "select empty_lob()"]程序员
ns_db dml $db "begin"
ns_db dml $db "update my_table set lob = $lob where my_key = $my_key"
ns_pg blob_dml_file $db $lob $tmp_filename
ns_db dml $db "end"sql
主要,调用时需将其包装在一个事务中,即便此时没有进行update。:
set lob [database_to_tcl_string $db "select lob from my_table
where my_key = $my_key"]
ns_pg blob_write $db $lob数据库
六、其余工具
Ispirer MnMTK:自动迁移整个数据库schema并将Oracle数据转换成PG的数据的工具集。
Full Convert:将Oracle转换成PG,每秒100K个记录。
Oracle to Postgres data migration and sync:每4-5分钟转换1M个记录。基于触发器的数据库同步方法和并行双向同步方式可帮助轻松地管理数据。
ESF Database Migration Toolkit:直连Oracle和PG,迁移表结构、数据、索引、主键、外键、内容等。
Orafce:兼容Oracle的函数。好比date函数(next_day,last_day,trunc,round等)、字符串函数、一些包DBMS_ALERT, DBMS_OUTPUT, UTL_FILE, DBMS_PIPE等。
Ora2pg:Perl脚本,兼容schema。链接Oracle,提取结构,产生SQL语句而后加载到PG。
Oracle to postgres:不使用ODBC和其余中间件。转换表结构、数据、索引、主键和外键。
ora_migrator:PL/pgSQL扩展,充分利用Oracle的Foreign Data Wrapper。
七、原文
https://wiki.postgresql.org/wiki/Oracle_to_Postgres_Conversion缓存