在互联网大厂必须遵照的MySql开发军规

时间 2019-11-06

标签互联网大厂必须遵照 mysql 开发军规栏目 MySQL 繁體版

原文原文链接

核心mysql

不在数据库作运算
单表数据量：一年内单表纯INT不超过1000W，含CHAR不超500W。单库不超过300~400表
表字段尽可能少，上限控制在20~50个
适当能够冗余(平衡范式和冗余)
拒绝大sql，大事务，大批量

字段sql

数值类型的字节和运用范围
若是能够，将字符串转化为数字存储。能够加快查询速度和节省空间，举例用INT代替CHAR(15)来存储IP
优先使用SET和ENUM...(可能有问题!)
避免使用NULL
少用TEXT/BLOB，若是必须使用(超过varchar最大限制64k)则必须拆分到单独的表
不在数据库存图片

索引数据库

能不加的索引尽可能不加，最好不超过字段数的20%(如：性别不加)，结合核心SQL优先考虑覆盖索引
字符字段必须建前缀索引。因为字符串很长，一般能够索引开始的几个字符，而不是所有值，以节约空间并获得好的性能。
不在索引列进行数学运算和函数运算(会致使没法使用索引 => 全表扫描)，如where id+1 = 100 和 id = 100 - 1，效率差很远
自增列或全局ID作INNODB的主键
尽可能不用外键(由程序保证约束)，高并发的时候容易死锁

SQL缓存

SQL语句尽量简单，由于一条SQL只能在一个CPU运算，在高并发的状况下，可能一条大SQL就把整个数据库堵死。而简单的SQL缓存命中率更高，减小锁表的时间(特别是MyISAM)，用上多CPU
保持事务、DB链接足够短，即开即用、用完就关。与事务无关操做放到事务外面，减小锁资源的占用;在不破坏一致性前提下，使用多个短事务代替长事务(如：发帖时的图片上传等待)
尽量少用存储过程，少用触发器，减用MySQL函数对结果进行处理(交由客户端程序负责)
尽可能少用select *，只取须要数据列，为使用覆盖索引提供可能性，减小临时表生成，更安全
用in()代替or，由于or的效率是O(n)，而in()的效率是O(Log n)。如：where a = 1 OR a = 100 与 where a IN (1, 100)
merge index每每很弱智，因此用union代替对多字段的or查询。如：select * from t where a = 1 OR b = 2 与 select * from t where a = 1 UNION select * from t where b = 2
尽可能避免负向查找，如NOT、!=等
尽可能避免%前缀模糊查询，因为使用的是B+ Tree，前缀模糊使用不了索引，致使全表扫描(后缀模糊速度相对快不少)
减小COUNT(*)，使用COUNT(col)，前者资源开销大，尽可能少用。MyISAM不带WHERE COUNT()而INNODB带WHERE COUNT()。计数的统计能够采用的方法：实时统计可使用memcache，双向更新，凌晨跑基准;非实时统计尽可能用单独统计表，按期重算
LIMIT高效分页：传统的方法是select * from t limit 10000, 10，推荐的方法是select * from t where id > 23423 limit 10。LIMIT的偏移量越大则越慢。还有一些高效的方法有：先取id来LIMIT偏移，减小总体的数据偏移;取到须要的id，与原表JOIN;程序取ID，而后用IN来填写。select * from t where id >= (select id from t limit 10000, 1) limit 10 , select * from t INNER JOIN (select id from t limit 10000, 10) USING (id) , select id from t limit 10000, 10; select * from t where id in (123, 456...)
若无需对结果进行去重，则用UNION ALL而非UNION(UNION有去重开销)
分解JOIN联接来保证高并发。高并发DB不建议进行两个表以上的JOIN
group by会默认自动升序排序，若是须要去掉排序，须要指定order by NULL
比较原则：数字对数字、字符对字符。若是数值列与字符类型做比较，同时转换成双精度;若是字符列与数值类型做比较，字符列整列转数值，且不会使用索引查询
load data导入数据比insert快约20倍(不须要刷新缓存)
尽可能不使用insert...select(延迟、同步出错)
大批量更新凌晨操做，避开高峰
SQL的一些命令：explain, show profile, mysqlsla, mysqldumpslow, show slow log, show processlist, show QUERY_RESPONSE_TIME(Percona)

约定安全

数据库在不一样时期使用不一样的：实时数据用real库，模拟环境用sim库，测试用qa库，开发用dev库
禁止未经DBA确认的子查询(大部分状况优化较差，特别是WHERE中使用IN id的子查询，通常能够用JOIN改写)
不要在程序上加锁数据库，由于外部锁对数据库不可控，高并发时是灾难，而且极难调试排查(能够采用事务来解决)
统一字符集：UTF-8，校对规则：utf8_general_ci
库和表的名称统一用小写(大小写敏感、且不一样操做系统都有不一样的限制);字段名大小写不敏感;索引名默认为idx_字段名;库名用缩写，尽可能在2~7个字母;避免用保留字命名