(5) 电商场景下的常见业务SQL处理

时间 2019-11-06

标签场景常见业务 sql 处理栏目 SQL 繁體版

原文原文链接

1. 如何对评论进行分页展现

通常状况下都是这样写mysql

SELECT customer_id,title,content FROM product_comment WHERE audit_status = 1 AND product_id =199726 LIMIT 0,15;;

咱们来看看它的执行计划sql

能够看到possible_keys、key、key_len的值均为NULL，说明这条SQL在product_comment 表上是没有可用的索引的，取出9593行过滤度为1%数据库

1. 创建索引，优化评论分页查询

根据咱们索引规范能够考虑在where条件上创建索引
where条件有两个字段，咱们能够经过如下语句计算一下两列数据在表中的区分度安全

计算字段数据区分度，创建索引

SELECT COUNT(DISTINCT audit_status)/COUNT(*) AS audit_rate,COUNT(DISTINCT product_id)/COUNT(*) AS product_rate FROM product_comment;

比值越接近1，表明区分度越好，咱们应该把区分度好的列放到联合索引的左侧优化

咱们如今创建索引后，再来看看执行计划3d

能够看到查询时运用到了联合索引，只查询出一条数据，就能返回咱们须要的数据了，过滤程度是百分之百，咱们完成了第一步优化日志

数据库的访问开销 = 索引 IO + 索引所有记录结果所对应的一个表数据的 IO

缺点

这种SQL语句查询的缺点是，越日后翻页，好比几千页以后，效率会愈来愈差，查询时间也会愈来愈长，尤为表数据量大的时候更是如此code

适用场景

它的适用场景是表的结果集很小，好比一万行如下时，或查询条件很是复杂，好比涉及到多个不一样的查询判断，或是表关联时使用blog

2. 进一步优化评论分页查询，SQL语句改写

改写后的SQL语句：排序

SELECT t.customer_id,t.title,t.content 
FROM (
SELECT customer_id  FROM product_comment WHERE  product_id =199726 AND audit_status = 1 LIMIT 0,15
)a JOIN product_comment t 
ON a.customer_id = t.comment_id;

改写前的SQL和改写后的SQL查询出来的结果集是同样的，可是效率要高于改写前的SQL

使用前提

使用这个SQL有一个前提是，商品评论表的主键是customer_id ，且是有覆盖索引（也就是刚刚咱们创建的联合索引）

优化原理

先根据过滤条件利用覆盖索引取出主键的comment_id，而后再进行排序，取出咱们所须要的数据的行数，而后再和评论表经过主键进行排序来取出其余的字段，
这种方式的数据开销是索引 IO +索引分页后的结果（15行数据）的表的IO，

优势

比改写前的SQL在IO上要节省不少，这种改写方式的优势是在每次翻页的所消耗的资源和时间基本是相同的，不会越日后翻页，效率越差

应用场景：

当查询和排序字段（即where子句和order by子句所涉及的字段），有对应的覆盖索引的状况下使用
而且查询的结果集很大的状况下也是适用于这种状况的

二. 如何删除重复数据

要求

删除评论表中对同一订单同一商品的重复评论，只保留最先的一条

步骤一

查看是否存在对于同一订单同一商品的重复评论，若是存在，进行后续步骤

查询语句：

SELECT order_id,product_id,COUNT(*) FROM product_comment
GROUP BY order_id,product_id HAVING COUNT(*) > 1;

步骤二

备份product_comment表（避免误删除的状况）

备份语句：

CREATE  TABLE bak_product_comment_190108 AS  SELECT * FROM product_comment;

若是提示：

错误代码：1786 Statement violates GTID consistency:CREATE TABLE ... SELECT.

则换用下面的语句

CREATE  TABLE bak_product_comment_190108 AS  LIKE  product_comment;
    INSERT INTO bak_product_comment_190108  SELECT * FROM product_comment；

错误代码：1786
Statement violates GTID consistency:CREATE TABLE ... SELECT.

错误缘由

这是由于在5.6及以上的版本内，开启了 enforce_gtid_consistency=true 功能致使的，MySQL官方解释说当启用 enforce_gtid_consistency 功能的时候，MySQL只容许可以保障事务安全，而且可以被日志记录的SQL语句被执行，像create table … select 和 create temporarytable语句，以及同时更新事务表和非事务表的SQL语句或事务都不容许执行。

解决办法

方法一

修改：

SET @@GLOBAL.ENFORCE_GTID_CONSISTENCY = off;

配置文件中：

ENFORCE_GTID_CONSISTENCY = off;

方法二：

create table xxx as select 的方式会拆分红两部分。

create table xxxx like data_mgr;
insert into xxxx select *from data_mgr;

若是表数据量比较大，则使用mysql dump的方式导出成文件进行备份

步骤三

删除同一订单的重复评论

删除语句：

DELETE a FROM product_comment a 
JOIN(
SELECT order_id,product_id,MIN(comment_id) AS comment_id 
FROM product_comment
GROUP BY order_id,product_id 
HAVING COUNT(*) > 1
) b on a.order_id = b.order_id AND a.product_id = b.product_id
AND a.comment_id > b.comment_id;

三. 如何进行分区间统计

要求

统计消费总金额大于1000元的，800到1000元的，500到800元的，以及500元如下的人数

SQL语句

SELECT 
COUNT(CASE WHEN IFNULL(total_money,0) >= 1000 THEN a.customer_id END) AS '大于1000'
,COUNT(CASE WHEN IFNULL(total_money,0) >= 800 AND IFNULL(total_money,0)<1000 
    THEN a.customer_id END) AS '800~1000'
,COUNT(CASE WHEN IFNULL(total_money,0) >= 500 AND IFNULL(total_money,0)<800 
    THEN a.customer_id END) AS '500~800'
,COUNT(CASE WHEN IFNULL(total_money,0) < 500 THEN a.customer_id END)  '小于500'
FROM mc_userdb.customer_login a 
LEFT JOIN 
( 
SELECT customer_id,SUM(order_money) AS total_money
    FROM mc_orderdb.order_master 
    GROUP BY customer_id
    ) b
ON a.customer_id = b.customer_id

检验一下结果是否正确

总和是10010，说明查询结果正确