Mysql 原生语句中save or update 的各类写法

时间 2019-11-06

原文原文链接

Mysql 原生语句中save or update 的各类写法

##背景在日常的开发中，常常碰到这种更新数据的场景：先判断某一数据在库表中是否存在，存在则update，不存在则insert。若是使用Hibernate，它自带saverOrUpdate方法，用起来很方便，但如使用原生sql语句呢？新手最多见的写法是，先经过select语句查询记录是否存在，存在则使用update语句更新，不存在则使用insert语句插入。可是这样作明显不够优雅，存在几个问题：html

为了执行一次更新操做，却在程序中使用了两次sql查询语句，在系统负载比较大的状况下，性能仍是会有影响的。
代码中存在if else语句，明明干了一件事，代码却很长。码农都是懒人，能把事情简单作的为啥要复杂作呢：）。

##那么问题来了，如何优雅的用sql语句实现saverOrUpdate？最近工做上也碰到相似更新数据的问题，写多了也开始以为烦。记得Oracle下有Merge的写法，就google一下mysql的相似实现，整理以下：mysql

###数据不存在则插入，存在则无操做在insert语句中使用ignore关键字实现数据不存在则插入，存在则无操做。它的实现逻辑是，当插入语句出现主键冲突，或者惟一键冲突时，不抛出错误，直接忽略这条插入语句。官网上的相关介绍以下：sql

If you use the IGNORE keyword, errors that occur while executing the INSERT statement are ignored. For example, without IGNORE, a row that duplicates an existing UNIQUE index or PRIMARY KEY value in the table causes a duplicate-key error and the statement is aborted. With IGNORE, the row is discarded and no error occurs. Ignored errors may generate warnings instead, although duplicate-key errors do not.性能

Mysql官方文档中提供标准的语法：测试

INSERT  IGNORE
    INTO tbl_name
    [PARTITION (partition_name,...)] 
    [(col_name,...)]
    {VALUES | VALUE} ({expr | DEFAULT},...),(...),...
或者  
INSERT IGNORE
    [INTO] tbl_name
    [PARTITION (partition_name,...)] 
    [(col_name,...)]
    SELECT ...

可见除了多了个IGNORE关键字之外，跟通常INSERT语句并没有区别。google

####举个栗子： 1.建一张测试用的表日志

CREATE TABLE `test_tab` (
  `name` varchar(64) NOT NULL,
  `age` int(11) NOT NULL,
  PRIMARY KEY (`name`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

2.插入一条数据code

insert into `test_tab` (`name`,`age`) values ('zhangsan',24)

当前test_tab表的数据为： name|age :----|:--- zhangsan|24 3.再执行一次步骤2的插入语句，则会报异常：orm

[Err] 1062 - Duplicate entry 'zhangsan' for key 'PRIMARY'

4.对步骤2的insert语句增长ignore关键字，则不会报异常，已存在的数据也不会被更新。htm

insert IGNORE into `test_tab` (`name`,`age`) values ('zhangsan',24) ;
------
语句执行状况：
受影响的行: 0
时间: 0.000s

当前test_tab表的数据为： name|age :----|:--- zhangsan|24

###不存在则插入，存在则更新，其一（使用DUPLICATE KEY UPDATE关键字）在insert语句中使用ON DUPLICATE KEY UPDATE关键字实现数据不存在则插入，存在则更新的操做。判断数据重复的逻辑依然是主键冲突或者惟一键冲突。官网上的相关介绍以下：

if you specify ON DUPLICATE KEY UPDATE, and a row is inserted that would cause a duplicate value in a UNIQUE index or PRIMARY KEY, an UPDATE of the old row is performed. The affected-rows value per row is 1 if the row is inserted as a new row, 2 if an existing row is updated, and 0 if an existing row is set to its current values.

Mysql官方文档中提供标准的语法：

INSERT 
    [INTO] tbl_name
    [PARTITION (partition_name,...)] 
    [(col_name,...)]
    {VALUES | VALUE} ({expr | DEFAULT},...),(...),...
    [ ON DUPLICATE KEY UPDATE
      col_name=expr
        [, col_name=expr] ... ]

或者：

INSERT 
    [INTO] tbl_name
    [PARTITION (partition_name,...)]
    SET col_name={expr | DEFAULT}, ...
    [ ON DUPLICATE KEY UPDATE
      col_name=expr
        [, col_name=expr] ... ]

或者：
INSERT 
    [INTO] tbl_name
    [PARTITION (partition_name,...)] 
    [(col_name,...)]
    SELECT ...
    [ ON DUPLICATE KEY UPDATE
      col_name=expr
        [, col_name=expr] ... ]

可见，仍是原来insert语句的写法。

####举个栗子： 1.使用刚才新建的test_tab表，此时表中的数据以下： name|age :----|:--- zhangsan|24

2.使用主键相同的insert语句，仍然会duplicate key错误

insert into `test_tab` (`name`,`age`) values ('zhangsan',50) ;
------------
[Err] 1062 - Duplicate entry 'zhangsan' for key 'PRIMARY'

3.对刚才的insert语句添加 on duplicate key update ... 关键字：

insert into `test_tab` (`name`,`age`) values ('zhangsan',50)  
ON DUPLICATE KEY UPDATE `age`=50 ;
------------
受影响的行: 2
时间: 0.025s

4.此时主键为'zhangsan'的数据，age字段已被更新： name|age :----|:--- zhangsan|50

5.固然，若是主键不冲突，效果跟通常插入语句是同样的：

insert into `test_tab` (`name`,`age`) values ('lisi',30)  
ON DUPLICATE KEY UPDATE `age`=30 ;
------------
受影响的行: 1
时间: 0.009s

name	age
zhangsan	50
lisi	30

###不存在则插入，存在则更新，其二（使用replace语句实现） save or update 在mysql中还有另外一种实现，即replace into语句，它用起来有点像Oracle的Merge。判断数据重复的逻辑依然是主键或者惟一键冲突。Mysql官方文档中提供标准的语法：

REPLACE [LOW_PRIORITY | DELAYED]
    [INTO] tbl_name
    [PARTITION (partition_name,...)] 
    [(col_name,...)]
    {VALUES | VALUE} ({expr | DEFAULT},...),(...),...
或:

REPLACE [LOW_PRIORITY | DELAYED]
    [INTO] tbl_name
    [PARTITION (partition_name,...)] 
    SET col_name={expr | DEFAULT}, ...
或:

REPLACE [LOW_PRIORITY | DELAYED]
    [INTO] tbl_name
    [PARTITION (partition_name,...)]  
    [(col_name,...)]
    SELECT ...

####举个栗子： 1.仍然使用上面的test_tab表的数据，此时数据以下 name|age :----|:--- zhangsan|50 lisi|30

2.使用通常的insert语句插入name=zhangsan的数据，报主键冲突。可是换成replace into...语句则没问题：

replace into `test_tab` (`name`,`age`) values ('zhangsan',30) ;
------------
受影响的行: 2
时间: 0.009s

3.结果以下： name|age :----|:--- zhangsan|30 lisi|30

对于操做结果来讲，很像是save or update，可是实现方式与INSERT的“DUPLICATE KEY UPDATE”关键字不一样。当使用replace into语句时，对于重复的数据，是直接删除，而后再插入新数据的。因此它的更新其实不是update，而是delete->insert。大多数状况下，使用replace into完成更新操做并没有问题，可是有一种场景必须特别注意：

当被更新的表，存在insert，update，和delete触发器时，使用replace语句必须特别当心。由于按照业务逻辑，更新完数据后，应该触发update触发器，可是使用replace语句的话，会触发delete和insert触发器，若是update触发器有一些特殊操做（好比记录操做日志）的话，使用replace会致使业务逻辑混乱。

因此当被更新表存在触发器的场景时，使用INSERT的“DUPLICATE KEY UPDATE”关键字更合适。

###参考资料

Mysql官网Insert语法介绍： http://dev.mysql.com/doc/refman/5.6/en/insert.html
Mysql官网Replace语法介绍： http://dev.mysql.com/doc/refman/5.6/en/replace.html