##背景 在日常的开发中,常常碰到这种更新数据的场景:先判断某一数据在库表中是否存在,存在则update,不存在则insert。 若是使用Hibernate,它自带saverOrUpdate方法,用起来很方便,但如使用原生sql语句呢? 新手最多见的写法是,先经过select语句查询记录是否存在,存在则使用update语句更新,不存在则使用insert语句插入。 可是这样作明显不够优雅,存在几个问题:html
##那么问题来了,如何优雅的用sql语句实现saverOrUpdate? 最近工做上也碰到相似更新数据的问题,写多了也开始以为烦。记得Oracle下有Merge的写法,就google一下mysql的相似实现,整理以下:mysql
###数据不存在则插入,存在则无操做 在insert语句中使用ignore关键字实现数据不存在则插入,存在则无操做。它的实现逻辑是,当插入语句出现主键冲突,或者惟一键冲突时,不抛出错误,直接忽略这条插入语句。官网上的相关介绍以下:sql
If you use the IGNORE keyword, errors that occur while executing the INSERT statement are ignored. For example, without IGNORE, a row that duplicates an existing UNIQUE index or PRIMARY KEY value in the table causes a duplicate-key error and the statement is aborted. With IGNORE, the row is discarded and no error occurs. Ignored errors may generate warnings instead, although duplicate-key errors do not.性能
Mysql官方文档中提供标准的语法:测试
INSERT IGNORE INTO tbl_name [PARTITION (partition_name,...)] [(col_name,...)] {VALUES | VALUE} ({expr | DEFAULT},...),(...),... 或者 INSERT IGNORE [INTO] tbl_name [PARTITION (partition_name,...)] [(col_name,...)] SELECT ...
可见除了多了个IGNORE关键字之外,跟通常INSERT语句并没有区别。google
####举个栗子: 1.建一张测试用的表日志
CREATE TABLE `test_tab` ( `name` varchar(64) NOT NULL, `age` int(11) NOT NULL, PRIMARY KEY (`name`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
2.插入一条数据code
insert into `test_tab` (`name`,`age`) values ('zhangsan',24)
当前test_tab表的数据为: name|age :----|:--- zhangsan|24 3.再执行一次步骤2的插入语句,则会报异常:orm
[Err] 1062 - Duplicate entry 'zhangsan' for key 'PRIMARY'
4.对步骤2的insert语句增长ignore关键字,则不会报异常,已存在的数据也不会被更新。htm
insert IGNORE into `test_tab` (`name`,`age`) values ('zhangsan',24) ; ------ 语句执行状况: 受影响的行: 0 时间: 0.000s
当前test_tab表的数据为: name|age :----|:--- zhangsan|24
###不存在则插入,存在则更新,其一(使用DUPLICATE KEY UPDATE关键字) 在insert语句中使用ON DUPLICATE KEY UPDATE关键字实现数据不存在则插入,存在则更新的操做。判断数据重复的逻辑依然是主键冲突或者惟一键冲突。 官网上的相关介绍以下:
if you specify ON DUPLICATE KEY UPDATE, and a row is inserted that would cause a duplicate value in a UNIQUE index or PRIMARY KEY, an UPDATE of the old row is performed. The affected-rows value per row is 1 if the row is inserted as a new row, 2 if an existing row is updated, and 0 if an existing row is set to its current values.
Mysql官方文档中提供标准的语法:
INSERT [INTO] tbl_name [PARTITION (partition_name,...)] [(col_name,...)] {VALUES | VALUE} ({expr | DEFAULT},...),(...),... [ ON DUPLICATE KEY UPDATE col_name=expr [, col_name=expr] ... ] 或者: INSERT [INTO] tbl_name [PARTITION (partition_name,...)] SET col_name={expr | DEFAULT}, ... [ ON DUPLICATE KEY UPDATE col_name=expr [, col_name=expr] ... ] 或者: INSERT [INTO] tbl_name [PARTITION (partition_name,...)] [(col_name,...)] SELECT ... [ ON DUPLICATE KEY UPDATE col_name=expr [, col_name=expr] ... ]
可见,仍是原来insert语句的写法。
####举个栗子: 1.使用刚才新建的test_tab表,此时表中的数据以下: name|age :----|:--- zhangsan|24
2.使用主键相同的insert语句,仍然会duplicate key错误
insert into `test_tab` (`name`,`age`) values ('zhangsan',50) ; ------------ [Err] 1062 - Duplicate entry 'zhangsan' for key 'PRIMARY'
3.对刚才的insert语句添加 on duplicate key update ... 关键字:
insert into `test_tab` (`name`,`age`) values ('zhangsan',50) ON DUPLICATE KEY UPDATE `age`=50 ; ------------ 受影响的行: 2 时间: 0.025s
4.此时主键为'zhangsan'的数据,age字段已被更新: name|age :----|:--- zhangsan|50
5.固然,若是主键不冲突,效果跟通常插入语句是同样的:
insert into `test_tab` (`name`,`age`) values ('lisi',30) ON DUPLICATE KEY UPDATE `age`=30 ; ------------ 受影响的行: 1 时间: 0.009s
name | age |
---|---|
zhangsan | 50 |
lisi | 30 |
###不存在则插入,存在则更新,其二(使用replace语句实现) save or update 在mysql中还有另外一种实现,即replace into语句,它用起来有点像Oracle的Merge。判断数据重复的逻辑依然是主键或者惟一键冲突。Mysql官方文档中提供标准的语法:
REPLACE [LOW_PRIORITY | DELAYED] [INTO] tbl_name [PARTITION (partition_name,...)] [(col_name,...)] {VALUES | VALUE} ({expr | DEFAULT},...),(...),... 或: REPLACE [LOW_PRIORITY | DELAYED] [INTO] tbl_name [PARTITION (partition_name,...)] SET col_name={expr | DEFAULT}, ... 或: REPLACE [LOW_PRIORITY | DELAYED] [INTO] tbl_name [PARTITION (partition_name,...)] [(col_name,...)] SELECT ...
####举个栗子: 1.仍然使用上面的test_tab表的数据,此时数据以下 name|age :----|:--- zhangsan|50 lisi|30
2.使用通常的insert语句插入name=zhangsan的数据,报主键冲突。可是换成replace into...语句则没问题:
replace into `test_tab` (`name`,`age`) values ('zhangsan',30) ; ------------ 受影响的行: 2 时间: 0.009s
3.结果以下: name|age :----|:--- zhangsan|30 lisi|30
对于操做结果来讲,很像是save or update,可是实现方式与INSERT的“DUPLICATE KEY UPDATE”关键字不一样。当使用replace into语句时,对于重复的数据,是直接删除,而后再插入新数据的。因此它的更新其实不是update,而是delete->insert。大多数状况下,使用replace into完成更新操做并没有问题,可是有一种场景必须特别注意:
因此当被更新表存在触发器的场景时,使用INSERT的“DUPLICATE KEY UPDATE”关键字更合适。
###参考资料