1.全部的数据库对象名称必须使用小写字母并用下划线分割(MySQL大小写敏感,名称要见名知意,最好不超过32字符)
2.全部的数据库对象名称禁止使用MySQL保留关键字(如 desc、range、match、delayed 等,请参考 MySQL官方保留字 )
3.临时库表必须以tmp为前缀并以日期为后缀(tmp_)
4.备份库和库必须以bak为前缀并以日期为后缀(bak_)
5.全部存储相同数据的列名和列类型必须一致。(在多个表中的字段如user_id,它们类型必须一致)
6.mysql5.5以前默认的存储的引擎是myisam,没有特殊要求,全部的表必须使用innodb(innodb好处支持失误,行级锁,高并发下性能更好,对多核,大内存,ssd等硬件支持更好)
7.数据库和表的字符集尽可能统一使用utf8(字符集必须统一,避免因为字符集转换产生的乱码,汉字utf8下占3个字节)
8.全部表和字段都要添加注释COMMENT,从一开始就进行数据字典的维护
9.尽可能控制单表数据量的大小在500w之内,超过500w可使用历史数据归档,分库分表来实现(500万行并非MySQL数据库的限制。过大对于修改表结构,备份,恢复都会有很大问题。MySQL没有对存储有限制,取决于存储设置和文件系统)
10.谨慎使用mysql分区表(分区表在物理上表现为多个文件,在逻辑上表现为一个表)
11.谨慎选择分区键,跨分区查询效率可能更低
12.建议使用物理分表的方式管理大数据
13.尽可能作到冷热数据分离,减少表的宽度(mysql限制最多存储4096列,行数没有限制,可是每一行的字节总数不能超过65535。列限制好处:减小磁盘io,保证热数据的内存缓存命中率,避免读入无用的冷数据)
14.禁止在表中创建预留字段(没法确认存储的数据类型,对预留字段类型进行修改,会对表进行锁定)
15.禁止在数据中存储图片,文件二进制数据(使用文件服务器)
16.禁止在线上作数据库压力测试
17.禁止从开发环境,测试环境直接连生产环境数据库
18.限制每张表上的索引数量,建议单表索引不超过5个(索引会增长查询效率,可是会下降插入和更新的速度)
19.避免创建冗余索引和重复索引(冗余:index(a,b,c) index(a,b) index(a))
20.禁止给表中的每一列都创建单独的索引
21.每一个innodb表必须有一个主键,选择自增id(不能使用更新频繁的列做为主键,不适用UUID,MD5,HASH,字符串列做为主键)
22.区分度最高的列放在联合索引的最左侧
23.尽可能把字段长度小的列放在联合索引的最左侧
24.尽可能避免使用外键(禁止使用物理外键,建议使用逻辑外键)
25.优先选择符合存储须要的最小数据类型
26.优先使用无符号的整形来存储
27.优先选择存储最小的数据类型(varchar(N),N表明的是字符数,而不是字节数,N表明能存储多少个汉字)
28.避免使用Text或是Blob类型
29.避免使用ENUM数据类型(修改ENUM值须要使用ALTER语句,ENUM类型的ORDER BY操做效率低,须要额外操做,禁止使用书值做为ENUM的枚举值
30.尽可能把全部的字段定义为NOT NULL(索引NULL须要额外的空间来保存,因此须要暂用更多的内存,进行比较和计算要对NULL值作特别的处理)
31.使用timestamp或datetime类型来存储时间
32.同财务相关的金额数据,采用decimal类型(不丢失精度,禁止使用 float 和 double)
33.避免使用双%号和like,搜索严禁左模糊或者全模糊(若是须要请用搜索引擎来解决。索引文件具备 B-Tree 的最左前缀匹配特性,若是左边的值未肯定,那么没法使用此索)
34.建议使用预编译语句进行数据库操做
35.禁止跨库查询(为数据迁移和分库分表留出余地,下降耦合度,下降风险)
36.禁止select * 查询(消耗更多的cpu和io及网络带宽资源,没法使用覆盖索引)
37.禁止使用不含字段列表的insert语句(不容许insert into t values(‘a’,‘b’,‘c’)不容许)
38.in 操做能避免则避免,若实在避免不了,须要仔细评估 in 后边的集合元素数量,控制在 1000 个以内
39.禁止使用order by rand()进行随机排序
40.禁止where从句中对列进行函数转换和计算(例如:where date(createtime)=‘20160901’ 会没法使用createtime列上索引。改为 where createtime>='20160901' and createtime <'20160902')
41.尽可能使用 union all 代替 union
42.拆分复杂的大SQL为多个小SQL( MySQL一个SQL只能使用一个CPU进行计算)
43.尽可能避免使用子查询,能够把子查询优化为join操做(子查询的结果集没法使用索引,子查询会产生临时表操做,若是子查询数据量大会影响效率,消耗过多的CPU及IO资源)
44.超过100万行的批量写操做,要分批屡次进行操做(大批量操做可能会形成严重的主从延迟,binlog日志为row格式会产生大量的日志,避免产生大事务操做)
45.对于大表使用pt—online-schema-change修改表结构(避免大表修改产生的主从延迟,避免在对表字段进行修改时进行锁表)
46.对于程序链接数据库帐号,遵循权限最小原则
47.超过三个表禁止 join。(须要 join 的字段,数据类型必须绝对一致;多表关联查询时,保证被关联的字段须要有索引。即便双表 join 也要注意表索引、SQL 性能。)
48.在varchar字段上创建索引时,必须指定索引长度,不必对全字段创建索引,根据实际文本区分度决定索引长度便可。
49.SQL 性能优化的目标:至少要达到 range 级别,要求是 ref 级别,若是能够是 consts最好
50.使用 ISNULL()来判断是否为 NULL 值。
51.禁止物理删除(即直接删除),只作逻辑删除,用deleteFlag作逻辑删除,若是删除,则为1,不删除则为0
52.若是有 order by 的场景,请注意利用索引的有序性。order by 最后的字段是组合,索引的一部分,而且放在索引组合顺序的最后,避免出现 file_sort 的状况,影响查询性能。
53.在代码中写分页查询逻辑时,若 count 为 0 应直接返回,避免执行后面的分页语句mysql