mysql百万数据实践-索引

时间 2019-11-10

标签 mysql 百万数据实践索引栏目 MySQL 繁體版

原文原文链接

今天实践一下mysql数据库在大数据量的状况下如何优化，这里记录一下过程。
首先是生成百万级别的数据，直接上sql语句mysql

//建表
CREATE TABLE `person` (
  `id` bigint(20) unsigned NOT NULL,
  `username` varchar(100) NOT NULL,
  `age` tinyint(3) unsigned NOT NULL,
  `sex` tinyint(1) unsigned NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=MyISAM DEFAULT CHARSET=utf8;

//建立生成数据procedure，num表明生成数据量的大小
CREATE PROCEDURE `generate`(IN num INT)  
BEGIN     
    DECLARE char_str varchar(100) DEFAULT 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789';
    DECLARE username VARCHAR(25) DEFAULT '';    
    DECLARE id int UNSIGNED;  
    DECLARE len int;  
    set id=1;  
    DELETE from person;  
    WHILE id <= num DO  
        set len = FLOOR(1 + RAND()*25);  
        set username = '';  
        WHILE len > 0 DO  
            SET username = CONCAT(username,substring(char_str,FLOOR(1 + RAND()*62),1));  
            SET len = len - 1;  
        END WHILE;   
        INSERT into person VALUES (id,username, FLOOR(RAND()*100), FLOOR(RAND()*2));  
        set id = id + 1;  
    END WHILE;  
END 
//最后执行generate，生成100万数据
CALL generate(1000000);

接下来就看看查询耗费时间：sql

//查询第100万条数据
select * from person where username=`select`;
//查询第1条数据
select * from person where username=`65YsbqoyqkbNhQb`;
//查询第50万条数据
select * from person where username=`cFzIG8`;

大概耗费0.16秒，若是是按照主键查询呢？数据库

//按照主键查询，mysql默认会为主键生成索引
//查询第100万条数据
select * from person where id=1000000;
//查询第1条数据
select * from person where id=1;
//查询第50万条数据
select * from person where id=500000;

耗费时间基本不多
那么为username建立索引看看效果大数据

create index index_user on person(username(100));

能够看到，查询时间和按主键进行查询差很少。说明索引对查询效果显著，可是相应的表的体积变大了，未建立索引以前表大概41.7M，建立完后表有59.8M。
下面看看插入的影响有多大。

能够看到有索引的插入语句耗时0.02秒，没有的基本忽略。优化