【mysql的设计与优化专题(3)】字段类型与合理的选择字段类型

时间 2019-11-08

标签 mysql 设计优化专题字段类型合理选择栏目 MySQL 繁體版

原文原文链接

本篇博客稍微有点长,它实际上包括两个内容:一是mysql字段类型的介绍,二是在mysql建表过程当中是如何正确选择这些字段类型;mysql

字段类型

数值

MySQL 的数值数据类型能够大体划分为两个类别，一个是整数，另外一个是浮点数或小数。
许多不一样的子类型对这些类别中的每个都是可用的，每一个子类型支持不一样大小的数据，而且 MySQL 容许咱们指定数值字段中的值是否有正负之分(UNSIGNED)或者用零填补(ZEROFILL)。
sql

INT
在 MySQL 中支持的 5 个主要整数类型是 TINYINT，SMALLINT，MEDIUMINT，INT 和 BIGINT。这些类型在很大程度上是相同的，只有它们存储的值的大小是不相同的。数据库

MySQL 以一个可选的显示宽度指示器的形式对 SQL 标准进行扩展(如 INT(6),6便是其宽度指示器,该宽度指示器并不会影响int列存储字段的大小,也就是说,超过6位它不会自动截取,依然会存储,只有超过它自己的存储范围才会截取;此处宽度指示器的做用在于该字段是否有zerofill,若是有就未知足6位的部分就会用0来填充)，这样当从数据库检索一个值时，能够把这个值加长到指定的长度。例如，指定一个字段的类型为 INT(6)，就能够保证所包含数字少于 6 个的值从数据库中检索出来时可以自动地用空格填充。须要注意的是，使用一个宽度指示器不会影响字段的大小和它能够存储的值的范围。
万一咱们须要对一个字段存储一个超出许可范围的数字，MySQL 会根据容许范围最接近它的一端截短后再进行存储。还有一个比较特别的地方是，MySQL 会在不合规定的值插入表前自动修改成 0。函数

unsigned 和 zerofill
UNSIGNED 修饰符规定字段只保存正值,即无符号,而mysql字段默认是有符号的。由于不须要保存数字的正、负符号，能够在储时节约一个"位"的空间(即翻一倍)。从而增大这个字段能够存储的值的范围。注意这个修饰符要紧跟在数值类型后面;性能

ZEROFILL 修饰符规定 0（不是空格）能够用来真补输出的值。使用这个修饰符能够阻止 MySQL 数据库存储负值,若是某列设置为zerofill,那它自动就unsigned。这个值要配合int,tinyint,smallint,midiumint等字段的宽度指示器来用;XXint(M),若是没有zerofill,这个M的宽度指示器是没有意义的.(注意,测试前导0的时候,仍是去黑窗口测试;)测试

为何mysql存储的值要分有符号和无符号呢?由于一个字节,占8bit;也就1个bit有0和1两种可能,8个bit就是2^8 = 256种可能,也就是0~255;但若是是有符号的话,就得拿一个1bit来存储这个负号,原本8bit只剩7bit,2^7 = 128,也就是-128~127(正数部分包含一个0);优化

FLOAT、DOUBLE 和 DECIMAL 类型
MySQL 支持的三个浮点类型是 FLOAT、DOUBLE 和 DECIMAL 类型。FLOAT 数值类型用于表示单精度浮点数值，而 DOUBLE 数值类型用于表示双精度浮点数值。加密

与整数同样，这些类型也带有附加参数：一个显示宽度指示器和一个小数点指示器(必需要带有指示器,要否则会查不到结果,而且宽度指示器和XXint类型的宽度指示器不一样,这里是有实际限制宽度的)。好比语句 FLOAT(7,3) 规定显示的值不会超过 7 位数字(包括小数位)，小数点后面带有 3 位数字。对于小数点后面的位数超过容许范围的值，MySQL 会自动将它四舍五入为最接近它的值，再插入它。
DECIMAL 数据类型用于精度要求很是高的计算中，这种类型容许指定数值的精度和计数方法做为选择参数。精度在这里指为这个值保存的有效数字的总个数，而计数方法表示小数点后数字的位数。好比语句 DECIMAL(7,3) 规定了存储的值不会超过 7 位数字，而且小数点后不超过 3 位。
FLOAT 类型在长度比较高好比 float(10,2)和 decimal(10,2)同时插入一个符合(10,2)宽度的数值,float 就会出现最后小数点出现一些出入;
UNSIGNED 和 ZEROFILL 修饰符也能够被 FLOAT、DOUBLE 和 DECIMAL 数据类型使用。而且效果与 INT 数据类型相同。spa

关于flaot和double调试

在这里我建议,干脆忘记mysql有double这个数据类型。至于why？就不要管它了

字符串类型

MySQL 提供了 8 个基本的字符串类型，能够存储的范围从简单的一个字符到巨大的文本块或二进制字符串数据。

BINARY
BINARY不是函数，是类型转换运算符，它用来强制它后面的字符串为一个二进制字符串，能够理解为在字符串比较的时候区分大小写

SELECT BINARY 'ABCD' = 'abcd' as COM1,'ABCD' = 'abcd' as COM2; -- COM1输出为0,COM2输出为1;

CHAR 和 VARCHAR 类型
CHAR 类型用于定长字符串，而且必须在圆括号内用一个大小修饰符来定义。这个大小修饰符的范围从 0-255。比指定长度大的值将被截短，而比指定长度小的值将会用空格做填补。

CHAR 类型可使用 BINARY 修饰符。当用于比较运算时，这个修饰符使 CHAR 以二进制方式参于运算，而不是以传统的区分大小写的方式。
CHAR 类型的一个变体是 VARCHAR 类型。它是一种可变长度的字符串类型，而且也必须带有一个范围在 0-255 之间的指示器。
CHAR 和 VARCHGAR 不一样之处在于 MYSQL 数据库处理这个指示器的方式：CHAR 把这个大小视为值的大小，不长度不足的状况下就用空格补足。而 VARCHAR 类型把它视为最大值而且只使用存储字符串实际须要的长度（增长一个额外字节来存储字符串自己的长度）来存储值。因此短于指示器长度的 VARCHAR 类型不会被空格填补，但长于指示器的值仍然会被截短。
由于 VARCHAR 类型能够根据实际内容动态改变存储值的长度，因此在不能肯定字段须要多少字符时使用 VARCHAR 类型能够大大地节约磁盘空间、提升存储效率。但若是确切知道字符串长度,好比就在50~55之间,那就用 CHAR 由于 CHAR 类型因为自己定长的特性使其性能要高于 VARCHAR;
VARCHAR 类型在使用 BINARY 修饰符时与 CHAR 类型彻底相同。

TEXT 和 BLOB 类型
对于字段长度要求超过 255 个的状况下，MySQL 提供了 TEXT 和 BLOB 两种类型。根据存储数据的大小，它们都有不一样的子类型。这些大型的数据用于存储文本块或图像、声音文件等二进制数据类型。

TEXT 和 BLOB 类型在分类和比较上存在区别。BLOB 类型区分大小写，而 TEXT 不区分大小写。大小修饰符不用于各类 BLOB 和 TEXT 子类型。比指定类型支持的最大范围大的值将被自动截短。

时间类型

在处理日期和时间类型的值时，MySQL 带有 5 个不一样的数据类型可供选择。

DATE、TIME 和 YEAR 类型
MySQL 用 DATE 和 YEAR 类型存储简单的日期值，使用 TIME 类型存储时间值。这些类型能够描述为字符串或不带分隔符的整数序列。若是描述为字符串，DATE 类型的值应该使用连字号做为分隔符分开，而 TIME 类型的值应该使用冒号做为分隔符分开。

须要注意的是，没有冒号分隔符的 TIME 类型值，将会被 MySQL 理解为持续的时间，而不是时间戳。
MySQL 还对日期的年份中的两个数字的值，或是 SQL 语句中为 YEAR 类型输入的两个数字进行最大限度的通译。由于全部 YEAR 类型的值必须用 4 个数字存储。MySQL 试图将 2 个数字的年份转换为 4 个数字的值。把在 00-69 范围内的值转换到 2000-2069 范围内。把 70-99 范围内的值转换到 1970-1979 以内。若是 MySQL 自动转换后的值并不符合咱们的须要，请输入 4 个数字表示的年份。

DATETIME 和 TIMESTAMP 类型
除了日期和时间数据类型，MySQL 还支持 DATETIME 和 TIMESTAMP 这两种混合类型。它们能够把日期和时间做为单个的值进行存储。这两种类型一般用于自动存储包含当前日期和时间的时间戳，并可在须要执行大量数据库事务和须要创建一个调试和审查用途的审计跟踪的应用程序中发挥良好做用。

若是咱们对 TIMESTAMP 类型的字段没有明确赋值，或是被赋与了 null 值。MySQL 会自动使用系统当前的日期和时间来填充它。

复合类型

MySQL 还支持两种复合数据类型 ENUM 和 SET，它们扩展了 SQL 规范。虽然这些类型在技术上是字符串类型，可是能够被视为不一样的数据类型。一个 ENUM 类型只容许从一个集合中取得一个值；而 SET 类型容许从一个集合中取得任意多个值。

ENUM 类型
ENUM 类型由于只容许在集合中取得一个值，有点相似于单选项。在处理相互排拆的数据时容易让人理解，好比人类的性别。ENUM 类型字段能够从集合中取得一个值或使用 null 值，除此以外的输入将会使 MySQL 在这个字段中插入一个空字符串。另外若是插入值的大小写与集合中值的大小写不匹配，MySQL 会自动使用插入值的大小写转换成与集合中大小写一致的值。

ENUM 类型在系统内部能够存储为数字，而且从 1 开始用数字作索引。一个 ENUM 类型最多能够包含 65536 个元素，其中一个元素被 MySQL 保留，用来存储错误信息，这个错误值用索引 0 或者一个空字符串表示。
MySQL 认为 ENUM 类型集合中出现的值是合法输入，除此以外其它任何输入都将失败。这说明经过搜索包含空字符串或对应数字索引为 0 的行就能够很容易地找到错误记录的位置。

SET 类型
SET 类型与 ENUM 类型类似但不相同。SET 类型能够从预约义的集合中取得任意数量的值。而且与 ENUM 类型相同的是任何试图在 SET 类型字段中插入非预约义的值都会使 MySQL 插入一个空字符串。若是插入一个即有合法的元素又有非法的元素的记录，MySQL 将会保留合法的元素，除去非法的元素。

一个 SET 类型最多能够包含 64 项元素。还去除了重复的元素，因此 SET 类型中不可能包含两个相同的元素。
但愿从 SET 类型字段中找出非法的记录只需查找包含空字符串或二进制值为 0 的行。

字段类型总结

虽然上面列出了不少字段类型,但最经常使用也就是 varchar(255),char(255),text,tinyint(4),smallint(6),mediumint,int(11)几种。
复合类型咱们通常用tinyint,更快的时间更省的空间以及更容易扩展
关于手机号，推荐用char(11),char(11)在查询上更有效率，由于手机号是一个活跃字段参与逻辑会不少。
一些经常使用字段举例
姓名：char(20)

价格：DECIMAL(7, 3)
产品序列号：SMALLINT(5) unsigned
文章内容: TEXT
MD5: CHAR(32)
ip: char(15)
time: int(10)
email char(32)

合理的选择数据类型

选择合理范围内最小的
咱们应该选择最小的数据范围，由于这样能够大大减小磁盘空间及磁盘I/0读写开销，减小内存占用，减小CPU的占用率。
选择相对简单的数据类型
数字类型相对字符串类型要简单的多，尤为是在比较运算时，因此咱们应该选择最简单的数据类型，_好比说在保存时间时，由于PHP能够良好的处理LINUX时间戳因此咱们能够将日期存为int(10)要方便、合适、快速的多_。

可是，工做中随着项目越作越多，业务逻辑的处理愈来愈难之后，我发现时间类型仍是用时间类型自己的字段类型要好一些，由于mysql有着丰富的时间函数供我使用，方便我完成不少与时间相关的逻辑，好比月排行榜，周排行榜，当日热门，生日多少天等等逻辑

不要使用null
为何这么说呢，由于MYSQL对NULL字段索引优化不佳，增长更多的计算难度，同时在保存与处理NULL类形时，也会作更多的工做，因此从效率上来讲，不建议用过多的NULL。有些值他确实有可能没有值，怎么办呢？解决方法是数值弄用整数0，字符串用空来定义默认值便可。
字符串类型的使用
字符串数据类型是一个万能数据类型，能够储存数值、字符串、日期等。

保存数值类型最好不要用字符串数据类型，这样存储的空间显然是会更大，并且在排序时字符串的9是大于22的，其实若是进行运算时mysql会将字符串转换为数值类型，大大下降效果，并且这种转换是不会走原有的索引的。
若是明确数据在一个完整的集合中如男，女，那么可使用set或enum数据类型，这种数据类型在运算及储存时以数值方式操做，因此效率要比字符串更好，同时空间占用更少。

VARCHAR与CHAR
- VARCHAR是可变长度字符串类型，那么即然长度是可变的就会使用1，2个字节来保存字符的长度，若是长度在255内使用1个字节来保存字符长度，不然使用2个字符来保存长度。因为varchar是根据储存的值来保存数据，因此能够大大节约磁盘空间。
  若是数据常常被执行更新操做，因为VARCHAR是根据内容来进行储存的，因此mysql将作更多的工做来完成更新操做，若是新数据长度大于老数据长度一些存储引擎会进行拆分操做处理。同时varchar会彻底保留内部全部数据，最典型的说明就是尾部的空格。
- CHAR固定长度的字符串保存类型，CHAR会去掉尾部的空格。在数据长度相近时使用char类型比较合适，好比md5加密的密码用户名等。
  若是数据常常进行更新修改操做，那么CHAR更好些，由于char长度固定，性能上要快。
数值类型的选择
数值数据类型要比字符串执行更快，区间小的数据类型占用空间更少，处理速度更快，如tinyint可比bigint要快的多

选择数据类型时要考虑内容长度，好比是保存毫米单位仍是米而选择不一样的数值类型

整数
整数类型不少好比tinyint、int、smallint、bigint等，那么咱们要根据本身须要存储的数据长度决定使用的类型，同时tinyint(10)与tinyint(100)在储存与计算上并没有任何差异，区别只是显示层面上，可是咱们也要选择适合合适的数据类型长度。能够经过指定zerofill属性查看显示时区别。
浮点数与精度数值浮点数float在储存空间及运行效率上要优于精度数值类型decimal，但float与double会有舍入错误而decimal则能够提供更加准确的小数级精确运算不会有错误产生计算更精确，适用于金融类型数据的存储。