不少查询均可以用经典的学生-课程-成绩案例来表示,下面是一些我在笔试或面试中遇到的经典题型。这些题目没有涉及到索引,函数,存储过程等高级功能,都是一些基本的查询语句,但难度却不小。mysql
create table student( id int unsigned primary key auto_increment, name char(10) not null ); insert into student(name) values('张三'),('李四'); create table course( id int unsigned primary key auto_increment, name char(20) not null ); insert into course(name) values('语文'),('数学'); create table student_course( sid int unsigned, cid int unsigned, score int unsigned not null, foreign key (sid) references student(id), foreign key (cid) references course(id), primary key(sid, cid) ); insert into student_course values(1,1,80),(1,2,90),(2,1,90),(2,2,70);
select id,name from student where name in ( select name from student group by name having(count(*) > 1) ) order by name;
咱们常常须要查询某一列重复的行,通常经过group by(有重复的列)而后取count>1的值。 关系型数据库有他的局限性, 有些看似简单的查询写出来的sql很复杂,并且效率也会很低。面试
select sid,avg(score) as avg_score from student_course group by sid having(avg_score<60);
group by和having是最常考的。 where子句中不能用汇集函数做为条件表达式,可是having短语能够,where和having的区别在于对用对象不一样,where做用于记录,having做用于组。sql
select distinct sid from student_course where sid not in (select sid from student_course where score < 80);
用到反向思想,其实就是数理逻辑中的∀x:P和¬∃x:¬P是等价的。数据库
select name,sum(score) total from student,student_course where student.id=student_course.sid group by sid;
更保险的作法应该是使用 左外链接函数
select name,sum(score) from student left join student_course on student.id=student_course.sid group by sid;
select sid,sum(score) as sum_score from student_course group by sid having sum_score>=all( select sum(score) from student_course group by sid );
由于order by中可使用汇集函数,最简单的方法是:code
select sid,sum(score) as sum_score from student_course group by sid order by sum_score desc limit 1;
同理能够查总成绩的前三名。对象
这是个查询 第N大数 的问题。 咱们先查出第2高的成绩:索引
select min(score) from student_course where cid = 1 group by score order by score desc limit 2;
使用这种方式是错的,由于做用的前后顺序是group by->min->order by->limit,mysql提供了limit offset,size这种方式来取第N大的值,所以正确的作法是:ci
select score from student_course where cid = 1 group by score order by score desc limit 1,1;
而后再取出该成绩对应的学生:rem
select * from student_course where cid=1 and score = ( select score from student_course where cid = 1 group by score order by score desc limit 1,1 );
相似的,能够查询 某个值第N高 的记录。
select sid,cid,max(score) from student_course group by cid;
然而上面是不对的,由于 使用了group by的查询字段只能是group by中的字段或者汇集函数或者是每一个分组内均相同的字段。 虽然不会报错,可是sid是无效的,若是去掉sid的话只能查出没门课程的最高分,不包含学生id。 本题的正确解法是使用相关嵌套查询:
select * from student_course as x where score>=( select max(score) from student_course as y where cid=x.cid );
相关嵌套查询也就是在进行内层查询的时候须要用到外层查询,有一些注意事项:
select * from student_course x where 2>( select count(*) from student_course y where y.cid=x.cid and y.score>x.score ) order by cid,score desc;
这也是一个相关嵌套查询,对于每个分数,若是同一门课程下只有0个、1个分数比这个分数还高,那么这个分数确定是前2名之一
select a.name, b.name
from team a, team b
where a.name < b.name
其实就是一个表和本身链接查询。
年 季度 销售
1991 1 11
1991 2 12
1991 3 13
1991 4 14
1992 1 21
1992 2 22
1992 3 23
1992 4 24
要求:写一个SQL语句查询出以下所示的结果。
年 一季度 二季度 三季度 四季度
1991 11 12 13 14
1992 21 22 23 24
select 年, sum(case when 季度=1 then 销售量 else 0 end) as 一季度, sum(case when 季度=2 then 销售量 else 0 end) as 二季度, sum(case when 季度=3 then 销售量 else 0 end) as 三季度, sum(case when 季度=4 then 销售量 else 0 end) as 四季度 from sales group by 年;
同理,若是要查询每一个人的每门课的成绩可使用以下sql
create view temp as select student.name as sname,course.name as cname,score from student_course join (student,course) on(student_course.sid=student.id and student_course.cid=course.id); select sname, sum(case when cname='语文' then score else 0 end) as 语文, sum(case when cname='数学' then score else 0 end) as 数学 from temp group by sname;
固然若是新增了一门课,第二条sql就须要跟着变。