二、group by 分组
通常状况下group需与统计函数(聚合函数)一块儿使用才有意义
如:select goods_id,goods_name,cat_id,max(shop_price) from goods group by cat_id;
这里取出来的结果中的good_name是错误的!由于shop_price使用了max函数,那么它是取最大的,而语句中使用了group by 分组,那么goods_name并无使用聚合函数,它只是cat_id下的第一个商品,并不会由于shop_price改变而改变
mysql中的五种统计函数:
(1)MAX:求最大值
select max(goods_price) from goods
这里会取出最大的价格的值,只有值
#查询每一个栏目下价格最高的
select cat_id,max(goods_price) from goos group by cat_id;
#查出价格最高的商品编号
select goods_id,max(goods_price) from goods group by goods_id;
(2)MIN:求最小值
(3)SUM:求总数和
#求商品库存总和
select sum(goods_number) from goods;
(4)AVG:求平均值
#求每一个栏目的商品平均价格
select cat_id,avg(goods_price) from goods group by cat_id;
(5)COUNT:求总行数
#求每一个栏目下商品种类
select cat_id,count(*) from goods group by cat_id;
三、having 与where 的异同点
having与where相似,能够筛选数据,where后的表达式怎么写,having后就怎么写
where针对表中的列发挥做用,查询数据
having对查询结果中的列发挥做用,筛选数据
#查询本店商品价格比市场价低多少钱,输出低200元以上的商品
select goods_id,good_name,market_price - shop_price as s from goods having s>200 ;
//这里不能用where由于s是查询结果,而where只能对表中的字段名筛选
若是用where的话则是:
select goods_id,goods_name from goods where market_price - shop_price > 200;
#同时使用where与having
select cat_id,goods_name,market_price - shop_price as s from goods where cat_id = 3 having s > 200;
#查询积压货款超过2万元的栏目,以及该栏目积压的货款
select cat_id,sum(shop_price * goods_number) as t from goods group by cat_id having s > 20000
#查询两门及两门以上科目不及格的学生的平均分
思路:
#先计算全部学生的平均分
select name,avg(score) as pj from stu group by name;
#查出全部学生的挂科状况
select name,score<60 from stu;
#这里score<60是判断语句,因此结果为真或假,mysql中真为1假为0
#查出两门及两门以上不及格的学生
select name,sum(score<60) as gk from stu group by name having gk > 1;
#综合结果
select name,sum(score<60) as gk,avg(score) as pj from stu group by name having gk >1;
四、order by
(1) order by price //默认升序排列
(2)order by price desc //降序排列
(3)order by price asc //升序排列,与默认同样
(4)order by rand() //随机排列,效率不高
#按栏目号升序排列,每一个栏目下的商品价格降序排列
select * from goods where cat_id !=2 order by cat_id,price desc;
五、limit
limit [offset,] N
offset 偏移量,可选,不写则至关于limit 0,N
N 取出条目
#取价格第4-6高的商品
select good_id,goods_name,goods_price from goods order by good_price desc limit 3,3;
#查询每一个栏目下最贵的商品
思路:
#先对每一个栏目下的商品价格排序
select cat_id,goods_id,goods_name,shop_price from goods order by cat_id,shop_price desc;
#上面的查询结果中每一个栏目的第一行的商品就是最贵的商品
#把上面的查询结果理解为一个临时表[存在于内存中]【子查询】
#再从临时表中选出每一个栏目最贵的商品
select * from (select goods_id,goods_name,cat_id,shop_price from goods order by cat_id,shop_price desc) as t group by cat_id;
#这里使用group by cat_id是由于临时表中每一个栏目的第一个商品就是最贵的商品,而group by前面没有使用聚合函数,因此默认就取每一个分组的第一行数据,这里以cat_id分组
良好的理解模型:
一、where后面的表达式,把表达式放在每一行中,看是否成立
二、字段(列),理解为变量,能够进行运算(算术运算和逻辑运算)
三、 取出结果能够理解成一张临时表
2、mysql子查询
一、where型子查询
(把内层查询结果看成外层查询的比较条件)
#不用order by 来查询最新的商品
select goods_id,goods_name from goods where goods_id = (select max(goods_id) from goods);
#取出每一个栏目下最新的产品(goods_id惟一)
select cat_id,goods_id,goods_name from goods where goods_id in(select max(goods_id) from goods group by cat_id);
二、from型子查询
(把内层的查询结果供外层再次查询)
#用子查询查出挂科两门及以上的同窗的平均成绩
思路:
#先查出哪些同窗挂科两门以上
select name,count(*) as gk from stu where score < 60 having gk >=2;
#以上查询结果,咱们只要名字就能够了,因此再取一次名字
select name from (select name,count(*) as gk from stu having gk >=2) as t;
#找出这些同窗了,那么再计算他们的平均分
select name,avg(score) from stu where name in (select name from (select name,count(*) as gk from stu having gk >=2) as t) group by name;
三、exists型子查询
(把外层查询结果拿到内层,看内层的查询是否成立)
#查询哪些栏目下有商品,栏目表category,商品表goods
select cat_id,cat_name from category where exists(select * from goods where goods.cat_id = category.cat_id);
3、链接查询
1、内链接(INNER JOIN)
内链接(INNER JOIN):有两种,显式的和隐式的,返回链接表中符合链接条件和查询条件的数据行。(所谓的连接表就是数据库在作查询造成的中间表)。
例如:下面的语句3和语句4的结果是相同的。
语句1:隐式的内链接,没有INNER JOIN,造成的中间表为两个表的笛卡尔积。
SELECT O.ID,O.ORDER_NUMBER,C.ID,C.NAME
FROM CUSTOMERS C,ORDERS O
WHERE C.ID=O.CUSTOMER_ID;mysql
语句2:显示的内链接,通常称为内链接,有INNER JOIN,造成的中间表为两个表通过ON条件过滤后的笛卡尔积。
SELECT O.ID,O.ORDER_NUMBER,C.ID,C.NAME
FROM CUSTOMERS C INNER JOIN ORDERS O ON C.ID=O.CUSTOMER_ID;sql
2、外联接(OUT JOIN)
外联接能够是左外联接、右外联接和完整外部联接。
在 FROM子句中指定外联接时,能够由下列几组关键字中的一组指定:
1)LEFT JOIN或LEFT OUTER JOIN
左向外联接的结果集包括 LEFT OUTER子句中指定的左表的全部行,而不只仅是联接列所匹配的行。若是左表的某行在右表中没有匹配行,则在相关联的结果集行中右表的全部选择列表列均为NULL。
2)RIGHT JOIN 或 RIGHT OUTER JOIN
右向外联接是左向外联接的反向联接。将返回右表的全部行。若是右表的某行在左表中没有匹配行,则将为左表返回NULL。
3)FULL JOIN 或 FULL OUTER JOIN
完整外部联接返回左表和右表中的全部行。当某行在另外一个表中没有匹配行时,则另外一个表的选择列表列包含NULL。若是表之间有匹配行,则整个结果集行包含基表的数据值。
数据库
#####练习:
例:现有表a
name hot
a 12
b 10
c 15
表b:
name hot
d 12
e 10
f 10
g 8
表a左链接表b,查询hot相同的数据
select a.*,b.* from a left join b on a.hot = b.hot
查询结果:
name hot name hot
a 12 d 12
b 10 e 10
b 10 f 10
c 15 null null
从上面能够看出,查询结果表a的列都存在,表b的数据只显示符合条件的项目
再如表b左链接表a,查询hot相同的数据
select a.*,b.* from b left join a on a.hot = b.hot
查询结果为:
name hot name hot
d 12 a 12
e 10 b 10
f 10 b 10
g 8 null null
再如表a右链接表b,查询hot相同的数据
select a.*,b.* from a right join b on a.hot = b.hot
查询结果和上面的bleft join a同样
###练习,查询商品的名称,所属分类,所属品牌
select goods_id,goods_name,goods.cat_id,goods.brand_id,category.cat_name,brand.brand_name
from goods
left join category
on goods.cat_id = category.cat_id
left join brand
on goods.brand_id = brand.brand_id
limit 5;
3、交叉联接 (CROSS JOIN)
交叉联接返回左表中的全部行,左表中的每一行与右表中的全部行组合。交叉联接也称做笛卡尔积。
FROM 子句中的表或视图可经过内联接或完整外部联接按任意顺序指定;可是,用左或右向外联接指定表或视图时,表或视图的顺序很重要
交叉链接(CROSS JOIN):有两种,显式的和隐式的,不带ON子句,返回的是两表的乘积。
例如:下面的语句1和语句2的结果是相同的。函数
语句1:隐式的交叉链接,没有CROSS JOIN。
SELECT O.ID, O.ORDER_NUMBER, C.ID, C.NAME
FROM ORDERS O , CUSTOMERS C
WHERE O.ID=1;性能
语句2:显式的交叉链接,使用CROSS JOIN。
SELECT O.ID,O.ORDER_NUMBER,C.ID,
C.NAME
FROM ORDERS O CROSS JOIN CUSTOMERS C
WHERE O.ID=1;优化
4、联合链接(UNION JOIN)
把两次或屡次的查询结果合并起来,要求查询的列数一致,推荐查询的对应的列类型一致,能够查询多张表,屡次查询语句时若是列名不同,则取第一次的列名!
若是不一样的语句中取出的行的每一个列的值都同样,那么结果将自动会去重复,若是不想去重复则要加all来声明,即union all)
## 现有表a以下
id num
a 5
b 10
c 15
d 10
表b以下
id num
b 5
c 10
d 20
e 99
求两个表中id相同的和
select id,sum(num) from (select * from ta union select * from tb) as tmp group by id;
//以上查询结果在本例中的确能正确输出结果,可是,若是把tb中的b的值改成10以查询结果的b的值就是10了,由于ta中的b也是10,因此union后会被过滤掉一个重复的结果,这时就要用union all
select id,sum(num) from (select * from ta union all select * from tb) as tmp group by id;
#取第四、5栏目的商品,按栏目升序排列,每一个栏目的商品价格降序排列,用union完成
select goods_id,goods_name,cat_id,shop_price from goods where cat_id=4
union select goods_id,goods_name,cat_id,shop_price from goods where cat_id=5
order by cat_id asc,shop_price desc;
【若是子句中有order by 须要用( ) 包起来,可是推荐在最后使用order by,即对最终合并后的结果来排序】
#取第三、4个栏目,每一个栏目价格最高的前3个商品,结果按价格降序排列
(select goods_id,goods_name,cat_id,shop_price from goods where cat_id=3 order by shop_price desc limit 3) union (select goods_id,goods_name,cat_id,shop_price from goods where cat_id=4 order by shop_price desc limit 3) order by shop_price desc;
4、SQL查询的基本原理:两种状况介绍。
第1、
单表查询:根据WHERE条件过滤表中的记录,造成中间表(这个中间表对用户是不可见的);而后根据SELECT的选择列选择相应的列进行返回最终结果。
第2、
两表链接查询:对两表求积(笛卡尔积)并用ON条件和链接链接类型进行过滤造成中间表;而后根据WHERE条件过滤中间表的记录,并根据SELECT指定的列返回查询结果。
第3、
多表链接查询:先对第一个和第二个表按照两表链接作查询,而后用查询结果和第三个表作链接查询,以此类推,直到全部的表都链接上为止,最终造成一个中间的结果表,而后根据WHERE条件过滤中间表的记录,并根据SELECT指定的列返回查询结果。
理解SQL查询的过程是进行SQL优化的理论依据。
5、ON后面的条件(ON条件)和WHERE条件的区别:
ON条件:是过滤两个连接表笛卡尔积造成中间表的约束条件。
WHERE条件:在有ON条件的SELECT语句中是过滤中间表的约束条件。在没有ON的单表查询中,是限制物理表或者中间查询结果返回记录的约束。在两表或多表链接中是限制链接造成最终中间表的返回结果的约束。
从这里能够看出,将WHERE条件移入ON后面是不恰当的。推荐的作法是:
ON只进行链接操做,WHERE只过滤中间表的记录。
6、总结
链接查询是SQL查询的核心,链接查询的链接类型选择依据实际需求。若是选择不当,非但不能提升查询效率,反而会带来一些逻辑错误或者性能低下。下面总结一下两表链接查询选择方式的依据:
一、 查两表关联列相等的数据用内链接。
二、 Col_L是Col_R的子集时用右外链接。
三、 Col_R是Col_L的子集时用左外链接。
四、 Col_R和Col_L彼此有交集但彼此互不为子集时候用全外。
五、 求差操做的时候用联合查询。
多个表查询的时候,这些不一样的链接类型能够写到一块。例如: SELECT T1.C1,T2.CX,T3.CY FROM TAB1 T1 INNER JOIN TAB2 T2 ON (T1.C1=T2.C2) INNER JOIN TAB3 T3 ON (T1.C1=T2.C3) LEFT OUTER JOIN TAB4 ON(T2.C2=T3.C3); WHERE T1.X >T3.Y; 上面这个SQL查询是多表链接的一个示范。