MySQL GROUP BY 和GROUP_CONCAT的一些用法

时间 2019-11-06

标签 mysql group concat 一些用法栏目 MySQL 繁體版

原文原文链接

1) 做用：GROUP BY 语句根据一个或多个列对结果集进行分组。mysql

所谓的分组就是根据GROUP BY中的分组标记,将一个“数据集”划分红若干个“小区域”，每一个分组标记相同的值,会划分在同一个"小区域中",最终查询出的结果只会显示"小区域"中一条记录。sql

2）GROUP BY 语句中的GROUP_CONCAT()函数函数

由于GROUP BY默认只显示了组中一条记录，若是想看组内的全部信息，就须要用到GROUP_CONCAT()函数测试

3）COUNT()函数：统计记录总数 ui

COUNT(*)会统计咱们表中的NULL值，若是不想统计NULL值，请写COUNT(字段名)spa

4）聚合函数[‘SUM()求和函数’,’MAX()函数：求最大值’,’MIN()函数：求最小值’,’AVG()函数：求平均值code

在GROUP BY的过程当中,若是碰到聚合函数,会进行聚合操做排序

MYSQL测试:内存

假设有数据表结构以下:table

CREATE TABLE `user_info` (
    `id` INT(11) NOT NULL AUTO_INCREMENT COMMENT '主键id',
    `user_id` VARCHAR(50) NOT NULL DEFAULT '' COMMENT '用户编号',
    `grade` VARCHAR(50) NOT NULL DEFAULT '' COMMENT '年级',
    `class` VARCHAR(50) NOT NULL DEFAULT '' COMMENT '班级',
    PRIMARY KEY (`id`),
    UNIQUE INDEX `uniq_user_id` (`user_id`)
)
ENGINE=InnoDB

插入记录:

INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (10, '10230', 'C', 'B');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (9, '10229', 'C', 'a');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (8, '10228', 'B', 'b');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (7, '10227', 'B', 'b');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (6, '10226', 'B', 'a');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (5, '10225', 'B', 'a');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (4, '10224', 'A', 'b');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (3, '10223', 'A', 'b');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (2, '10222', 'A', 'a');
INSERT INTO `user_info` (`id`, `user_id`, `grade`, `class`) VALUES (1, '10221', 'A', 'a');

全部记录查询结果:

查询grade,和user_id的全部记录

mysql> SELECT user_id,grade FROM user_info;
+---------+-------+
| user_id | grade |
+---------+-------+
| 10221 | A |
| 10222 | A |
| 10223 | A |
| 10224 | A |
| 10225 | B |
| 10226 | B |
| 10227 | B |
| 10228 | B |
| 10229 | C |
| 10230 | C |
+---------+-------+

group by的常规用法

1.以grade分组,而且查看user_id信息

mysql> SELECT user_id,grade FROM user_info GROUP BY grade ;
+---------+-------+
| user_id | grade |
+---------+-------+
| 10221 | A |
| 10225 | B |
| 10229 | C |
+---------+-------+

由结果可知:使用GROUP BY分组以后,每一个分组标记相同的记录只会出现第一条,其余的相同的分组标记的记录会舍弃

2.利用GROUP_CONCAT查看user_id的详细信息

mysql> SELECT GROUP_CONCAT(user_id),grade FROM user_info GROUP BY grade ;
+-------------------------+-------+
| GROUP_CONCAT(user_id) | grade |
+-------------------------+-------+
| 10221,10222,10223,10224 | A |
| 10228,10227,10226,10225 | B |
| 10229,10230 | C |
+-------------------------+-------+

3.聚合函数max

mysql> select max(user_id),grade from user_info group by grade ;
+--------------+-------+
| max(user_id) | grade |
+--------------+-------+
| 10224 | A |
| 10228 | B |
| 10230 | C |
+--------------+-------+

4.having条件进一步过滤

mysql> select max(user_id),grade from user_info group by grade having grade>'A';
+--------------+-------+
| max(user_id) | grade |
+--------------+-------+
| 10228 | B |
| 10230 | C |
+--------------+-------+

group by的很是规用法

1.查询的列中除了聚合列,分组列标识还有其余常规列,常规列如何取值?

mysql> select max(user_id),id,grade from user_info group by grade;
+--------------+----+-------+
| max(user_id) | id | grade |
+--------------+----+-------+
| 10224 | 1 | A |
| 10228 | 5 | B |
| 10230 | 9 | C |
+--------------+----+-------+

sql的结果就值得讨论了，与上述例子不一样的是，查询条件多了id一列。数据按照grade分组后，grade一列是相同的，max(user_id)按照数据进行计算也是惟一的，id一列是如何取值的？看上述的数据结果，
推论：id是物理内存的第一个匹配项

2.修改id按照上述数据结果，将id=1，改成id=99，执行相同SQL：

mysql> select max(user_id),id,grade from user_info group by grade;
+--------------+----+-------+
| max(user_id) | id | grade |
+--------------+----+-------+
| 10224 | 2 | A |
| 10228 | 5 | B |
| 10230 | 9 | C |
+--------------+----+-------+

推论:第一条数据id变成了99，查出的结果第一条数据的id从1变成了2。代表，id这个非聚合条件字段的取值与数据写入的时间无关，由于id=1的记录是先于id=2存在的，修改的数据不过是修改了这条数据的内容。结合mysql的数据存储理论，因为id是主键，因此数据在检索是是按照主键排序后进行过滤的，所以
推论：id字段的选取是按照mysql存储的检索数据匹配的第一条。

3.聚合函数和常量在一块儿作运算

mysql> SELECT GROUP_CONCAT(user_id),grade,SUM(user_id)+9,SUM(user_id) FROM user_info GROUP BY grade ;
+-------------------------+-------+----------------+--------------+
| GROUP_CONCAT(user_id) | grade | SUM(user_id)+9 | SUM(user_id) |
+-------------------------+-------+----------------+--------------+
| 10222,10221,10224,10223 | A | 40899 | 40890 |
| 10225,10226,10228,10227 | B | 40915 | 40906 |
| 10229,10230 | C | 20468 | 20459 |
+-------------------------+-------+----------------+--------------+

当GROUP BY 碰到聚合函数和常量在一块儿的时候,聚合函数会正常发挥做用,可是常量只会计算一次,即在聚合完成以后,再和常量运算,而不是user_id和常量一块儿累加

注意:这种常量有多是变量,例如多表查询的时候

SELECT COALESCE(SUM(t2.SUMS),0)+(SELECT COALESCE(SUM(t3.SUMS),0) FROM table3 t3 WHERE t3.UID=t2.uid) FROM table1 t1 LEFT JOIN table2 t2 ON ..... GROUP BY t2.uid

其中COALESCE(SUM(t2.SUMS),0)是聚合函数,在group by的时候每次都会累加求和

而(SELECT COALESCE(SUM(t3.SUMS),0) FROM table3 t3 WHERE t3.UID=t2.uid)做为一个常量,总共只会加入一次,可是每一行记录的这个值多是不一样的,

若是想要查看每次累加具体的值,可使用GROUP_CONCAT((SELECT COALESCE(SUM(t3.SUMS),0) FROM table3 t3 WHERE t3.UID=t2.uid)),注意GROUP_CONCAT中也要去除聚合函数:

SELECT 
GROUP_CONCAT(t2.SUMS),
GROUP_CONCAT(SELECT COALESCE(SUM(t3.SUMS),0) FROM table3 t3 WHERE t3.UID=t2.uid),
(SELECT COALESCE(SUM(t3.SUMS),0) FROM table3 t3 WHERE t3.UID=t2.uid) FROM table1 t1 LEFT JOIN table2 t2 ON .....

也能够先不使用分组,把分组条件去掉,同时也要去除聚合函数(聚合函数若是不分组整个表只会返回一条记录;若是分组,则返回不一样的分组标记中的一条记录):

SELECT t2.SUMS,(SELECT COALESCE(SUM(t3.SUMS),0) FROM table3 t3 WHERE t3.UID=t2.uid) FROM table1 t1 LEFT JOIN table2 t2 ON .....

示例: 仍是在user_info表,根据grade分组,查询每一个分组中user_id之和加上ID总和的数值(模拟两个表来统计每一个部门的user_id之和和另一个表的字段的ID总和)

mysql> SELECT SUM(user_id),SUM(user_id)+id,GROUP_CONCAT(user_id),GROUP_CONCAT(id) grade FROM user_info GROUP BY grade;
+--------------+-----------------+-------------------------+----------+
| SUM(user_id) | SUM(user_id)+id | GROUP_CONCAT(user_id) | grade |
+--------------+-----------------+-------------------------+----------+
| 40890 | 40892 | 10222,10221,10224,10223 | 2,99,4,3 |
| 40906 | 40911 | 10225,10226,10228,10227 | 5,6,8,7 |
| 20459 | 20468 | 10229,10230 | 9,10 |
+--------------+-----------------+-------------------------+----------+

上述结果能够看出:SUM(user_id)+id中的id做为常量,在分组的时候,只计算了一次(2,99,4,3中只把2累加进去了,其余值舍弃,即若是不为聚合函数,只会参与一次)

想所有计算能够这样:

SELECT SUM(user_id),SUM(user_id)+(SELECT SUM(ID) FROM user_info),GROUP_CONCAT(user_id),GROUP_CONCAT(id), grade FROM user_info GROUP BY grade;

上面是模仿多表,若是只有一个表,能够这样:

SELECT SUM(user_id),SUM(user_id+id),GROUP_CONCAT(user_id),GROUP_CONCAT(id), grade FROM user_info GROUP BY grade;

结果:

mysql> SELECT SUM(user_id),SUM(user_id)+(SELECT SUM(ID) FROM user_info),GROUP_CONCAT(user_id),GROUP_CONCAT(id), grade FROM user_info GROUP BY grade;
+--------------+----------------------------------------------+-------------------------+------------------+-------+
| SUM(user_id) | SUM(user_id)+(SELECT SUM(ID) FROM user_info) | GROUP_CONCAT(user_id) | GROUP_CONCAT(id) | grade |
+--------------+----------------------------------------------+-------------------------+------------------+-------+
| 40890 | 41043 | 10222,10221,10224,10223 | 2,99,4,3 | A |
| 40906 | 41059 | 10225,10226,10228,10227 | 5,6,8,7 | B |
| 20459 | 20612 | 10229,10230 | 9,10 | C |
+--------------+----------------------------------------------+-------------------------+------------------+-------+

结论

当group by 与聚合函数配合使用时，功能为分组后计算
当group by 与having配合使用时，功能为分组后过滤
当group by 与聚合函数，同时非聚合字段同时使用时，非聚合字段的取值是第一个匹配到的字段内容，即id小的条目对应的字段内容。