系列文章目录mysql
表格是资料库储存资料的基本元件,它是由一些栏位组合而成的,储存在表格中的每一笔纪录就拥有这些栏位的资料。以储存城市资料的表格「city」来讲,设计这个表格的人但愿一个城市资料须要包含编号、名称、国家代码、区域和人口数量,因此他为「city」表格设计了这些「栏位(column)」:sql
储存在表格中的每一笔资料称为「列(row)」或「纪录(record)」:segmentfault
在设计表格的时候,一般会指定一个栏位为「主索引键(primary key)」:svg
注:主索引键会在「第八章、表格与索引」中详细的讨论。工具
资料库中能够储存各类不一样的资料,SQL提供许多不一样的「资料型态」让你应付这些不一样的需求。在开始查询资料以前,你要先认识最多见、也是最基本的资料型态。第一种是数值,为了更精准的保存数值资料,SQL提供整数与小数两种数值型态:spa
你能够依照本身的需求,使用储存的数值资料执行数学运算:设计
经常使用的资料型态还有「字串」与「日期」:3d
在SQL叙述中使用字串资料的时候,字串资料的先后要使用单引号或双引号:code
使用日期资料的时候,MySQL资料库预设的日期格式是「年-月-日」。与字串资料同样,先后也要使用单引号或双引号:cdn
注:字串与日期资料型态会在「第七章、储存引擎与资料型态、栏位资料型态」中详细的讨论。
另一种在资料库中比较特殊的资料型态是「NULL」,它不像数值、字串或日期资料型态是一个明确的资料,「NULL」是用来表示「不肯定」、「未知」或「没有」的资料:
2 查询叙述
在执行资料库的操做中,查询算是最多见也是最复杂的工做,因此一个查询叙述所使用到的子句也最多,下列是查询叙述的基本语法:
这一章会讨论「SELECT」、「FROM」、「WHERE」、「ORDER BY」和「LIMIT」五个子句组合起来的查询叙述。其它的子句会在下一章继续讨论。
在你使用「SELECT」搭配各类子句来查询资料时,要特别注意子句使用的顺序:
就算你每个子句的写法都没有出错,若是顺序不对了:
一个资料库伺服器能够创建许多须要的资料库,因此在你执行任何资料库的操做前,一般要先指定使用的资料库。下列是指定资料库的指令:
若是你使用「MySQL Workbench」这类的工具软体,画面上看起来会像这样:
一个SQL查询叙述必定要以「SELECT」子句开始,再搭配其它的子句完成查询资料的工做。你能够单独使用「SELECT」子句,只不过这样的用法跟资料库一点关系都没有,它只不过把你输入的内容显示出来而已:
例以下列的查询叙述,只是简单的显示字串和计算结果,并不会查询资料库中的资料:
SELECT 'My name is Simon Johnson', 35 * 12
通常所谓的查询叙述,一般是查询资料库中的资料,因此「SELECT」子句会搭配「FROM」子句来使用,而「SELECT」后面能够指定「*」表示要查询指定表格的全部栏位:
若是目前使用中的资料库为「world」,下列的叙述能够查询「world」资料库中,「city」表格的全部资料:
SELECT * FROM city
一个资料库伺服器能够创建许多须要的资料库,因此在你执行任何资料库的操做前,都要使用「USE」叙述指定一个使用中的资料库。不过你也能够在SQL叙述中使用下列的语法来指定资料库:
若是目前使用中的资料库是「world」,你不用先使用「USE cmdev」叙述切换使用中的资料库,可使用下列的语法查询「cmdev」资料库中的「emp」表格:
SELECT * FROM cmdev.emp
有时候你并不须要查询一个表格中全部的栏位,因此你能够在「SELECT」子句后面本身指定须要的栏位:
若是你在「SELECT」后面使用「*」的话:
你能够依照本身的须要决定要查询哪些栏位和顺序:
除了查询表格中的栏位外,你能够加入任何须要的运算,这里先讨论通常常见的数学运算。下列是很经常使用来执行数学运算的运算子:
优先顺序 | 运算子 | 说明 | 范例 | 运算结果 |
---|---|---|---|---|
1 | % | 余数 | 7 % 3 | 1 |
1 | MOD | 余数 | 7 MOD 3 | 1 |
1 | * | 乘 | 7 * 3 | 21 |
1 | / | 除 | 7 / 3 | 2.333 |
1 | DIV | 除(整数) | 7 DIV 3 | 2 |
2 | + | 加 | 7 + 3 | 10 |
2 | - | 减 | 7 – 3 | 4 |
注:优先顺序的数字从1开始,1表示优先权比较高,2比较低,以此类推。就跟通常数学运算的先乘除后加减同样:在一个运算式中,优先权高的先算完,再换低优先权继续算;一样优先权的就由左到右计算。你也能够在运算式中使用左右括号,括号中的运算会先执行。
以「cmdev」资料库中的员工表格(emp)来讲,想要计算员工的年薪,就可使用这些运算子来完成你的查询工做:
你能够另外为「SELECT」后面查询的资料取一个本身想要的名称,这个做法称为「别名(alias
name)」:
取栏位别名会让执行查询后的结果,使用你本身取的名称为栏位名称:
注:帮通常栏位取一个栏位别名是比较没有必要的,若是是运算式的话,一般就要帮它取一个栏位别名来取代原来一大串的运算式。
在取栏位别名的时候要特别注意下列的情况:
另外若是你「坚持」要使用SQL语法中的保留字来看成栏位别名的话:
若是违反上列两个规定,执行叙述之后会发生错误。
3 条件查询
使用「SELECT」和「FROM」执行的查询叙述,是把你在「FROM」子句指定表格里全部的纪录传回来。资料库最大的好处就是能够随时依照须要查询部份纪录资料,你能够搭配「WHERE」子句执行查询条件的设定:
要使用「WHERE」执行查询条件的设定,你会使用下列基础的比较运算子:
|优先顺序 |运算子| 说明|
|1| =| 等于|
|1| <=>
| 等于|
|1| !=
| 不等于|
|1| <
| 小于|
|1| <=
| 小于等于|
|1| >
| 大于|
|1| >=
| 大于等于|
注:<=>
运算子在后面「NULL值的判断」会讨论。
使用这些基础的比较运算子就能够完成一些简单的条件设定:
设定日期资料型态的条件也是很常见的:
查询条件的设定,有时候会像前面讨论的单一条件同样,并不会太复杂;不过也很常遇到在一个查询的需求中,须要设定一个以上的条件,那你就会用到下列的运算子:
优先顺序 | 运算子 | 说明 |
---|---|---|
1 | NOT | 非 |
2 | && | 并且 |
2 | AND | 并且 |
3 | || |
或 |
3 | OR | 或 |
3 | XOR | 互斥 |
「NOT」运算子比较特殊一些,在通常的需求中,比较不会用到它。如下列的需求来讲:
若是想要查询国家代码是「TWN」,并且人口数量小于十万的城市,就必须设定两个条件,而两个条件之间,依照「并且」的需求,使用「AND」来结合两个条件:
若是想要查询国家代码是「TWN」或是「USA」的城市,在两个条件之间依照「或」的需求,使用「OR」来结合两个条件:
在逻辑运算子的介绍中,它们也一样有「优先顺序」的。若是你想要查询在欧洲(Europe)或非洲(Aftica)国家,并且人口数要小于一万。使用下列的查询条件所获得的资料,跟你想要的却不同:
若是有多个查询条件的设定,所有都是「AND」或所有都是「OR」的话,就没有这类问题;若是查询条件中,有「AND」和「OR」同时出现的话,就要依照你的须要,视状况加上左右刮号来控制条件的设定:
通常的条件和逻辑运算子,已经能够应付大部份的查询条件需求。下列还有一些能够用在特殊用途或是提供替代写法的条件设定:
「BETWEEN … AND …」用来执行一个指定范围条件的设定:
若是要查询人口数量在八万到九万之间的城市资料,能够有下列两种条件的写法,它们执行之后的结果是彻底同样的:
使用「BETWEEN … AND …」的条件设定会包含指定的资料,因此下列两个查询条件所获得的结果就不同了:
「BETWEEN … AND …」使用在日期资料时,也能够完成某一个日期范围的判断:
「IN (…)」使用在一组成员资料的比对条件设定:
下列两个查询叙述,均可以获得国家代码是「TWN、USA、JPN、ITA和KOR」的城市资料,但是使用「IN (…)」来设定条件的话,看起来会简洁不少:
在国家表格中,有一个储存平均寿命的栏位「LifeExpectancy」,不过资料库中的资料并无很完整,因此有一些国家是没有这个资料的,因此会使用「NULL」值来表示:
若是想要查询没有平均寿命资料的国家,也就是平均寿命的栏位值是「NULL」,你可能会使用下列的叙述:
SELECT Name, LifeExpectancy FROM country WHERE LifeExpectancy = NULL
上列的叙述执行之后,并无传回任何纪录,这表示并无资料符合你设定的查询条件。
因此「NULL」值的判断,不可使用判断通常资料的条件设定:
注:<=>
在判断通常资料的时候,跟「=」彻底同样;不过它用在判断「NULL」资料的时候,效果跟「IS」同样。
若是换成要查询「有」平均寿命资料的国家,也就是平均寿命的栏位值不是「NULL」:
在使用字串资料的条件判断时,会有一种很常见、也比较特殊的需求,像是「想要查询名称以w字元开始的城市」,若是你使用下列的查询叙述:
SELECT Name FROM city WHERE Name = 'w'
这样的查询条件,固然不是「名称以w字元开始的城市」,而是名称只有一个「w」字元的城市。因此这类的查询就会使用下列这个特殊的条件设定:
上列语法中,在「LIKE」后面的「样版」字串中,会使用到下列两种「样版字元」:
因此要查询「名称以w字元开始的城市」的话:
参考上列的做法,就能够延伸出其它的查询条件设定了:
上列的查询条件中,「w%」表示第一个字元是「w」就符合条件;「%w」表示最后一个字元是「w」就符合条件;最后一个「%w%」表示不论在什么位置有「w」字元,都符合条件。
另一种样版字元「_」表示一个任何字元:
把这些样版中的底线换到后面的话:
你也能够搭配两种样版字元完成条件的设定:
甚至像查询「名称是三十(包含)个字元以上的城市」:
注:其实完成上列的查询条件的需求是不用这么麻烦的,在后面的章节会讨论比较简单的方式。
在你执行任何一个查询之后,MySQL传回的资料是依照「天然」的顺序排列的。所谓的天然顺序,一般是资料新增到表格中的顺序,但是在资料库运做一段时间后,陆续会有各类不一样的操做,因此这个「天然」顺序对你来讲,一般是没什么意义的。
通常的查询一般会有资料排序上的需求,因此你会使用「ORDER BY」子句:
若是你但愿在查询城市资料的时候,资料库会依照国家代码帮你排序的话:
你也能够指定资料排列的顺序为由大到小:
「ORDER BY」子句后面能够依照需求指定多个排序的资料:
「ORDER BY」子句后面指定多个排序资料的时候,均可以依照需求,各自指定资料排列的方式:
「ORDER BY」子句指定的资料能够是栏位名称、编号、运算式或是栏位别名:
虽然比较不会有下列这样的需求,不过你仍是能够这样做:
注:资料排列的顺序在「第六章、字元集与资料库」与「第七章、储存引擎与资料型态」中进一步详细的讨论。
在你执行一个查询叙述后,资料库会将你查询的资料传回来给你;若是你使用「WHERE」子句设定查询条件的话,资料库就只会传回符合条件的资料;除了上列的情况外,你也能够另外使用「LIMIT」子句指定回传纪录的数量:
若是你在「LIMIT」子句后面指定一个数字:
「LIMIT」子句后面也能够指定两个数字:
在查询叙述中,使用「ORDER BY」子句搭配「LIMIT」子句,就能够完成下列查询「排名」的工做:
注:若是出现相似「… LIMIT 1000000, 10」这样的查询叙述,虽然你只会获得十笔资料,资料库总共会查询一百万零一十笔资料,只不过资料库会帮你跳过前一百万笔;相似这样的需求,仍是要使用「WHERE」子句先挑出想要的资料会比较好一些。
在一个查询叙述执行之后,资料库不会帮你检查回传的资料是否重复(回传的两笔纪录资料彻底同样),在「SELECT」子句后面可让你设定「回传的资料是否重复」:
没有使用「ALL」或「DISTINCT」的效果,跟你本身加上「ALL」的查询效果是同样的,资料库会依照你的查询传回全部的资料:
使用「DISTINCT」的话,资料库会特别执行回传纪录是否重复的检查:
via codedata