导读
刚刚导入了几千万数据,却意外的查不到,这是为什么?mysql
先执行COUNT(*)统计总数程序员
[root@yejr.me]> select count(*) from t1; +----------+ | count(*) | +----------+ | 0 | +----------+ 1 row in set (1 min 25.85 sec)
SQL运行的有点慢,结果的确是空的。sql
再任意查询一条记录看看:ide
[root@yejr.me]> select * from t1 limit 1; Empty set (13.63 sec)
只查一条记录而已,这SQL运行的也忒慢了点,结果也仍是空的。职业规划
好吧,再看看表的状态:线程
[root@yejr.me]> show table status G *************************** 1. row *************************** Name: t1 Engine: InnoDB Version: 10 Row_format: Dynamic Rows: 28159173 Avg_row_length: 45 Data_length: 1269825536 Max_data_length: 0 Index_length: 1308606464 Data_free: 1063256064 Auto_increment: 12851381 Create_time: 2019-06-04 10:49:44 Update_time: NULL Check_time: NULL Collation: utf8mb4_general_ci Checksum: NULL Create_options: Comment: 1 row in set (0.00 sec) [root@yejr.me]# ll -rw-r----- 1 mysql mysql 67 Jun 4 10:34 db.opt -rw-r----- 1 mysql mysql 8732 Jun 4 10:49 t1.frm -rw-r----- 1 mysql mysql 2931818496 Jun 4 13:09 t1.ibd
看着明明是有数据的呀,真特么邪门,下巴都快掉了。code
再看看执行SELECT时的线程状态,发现是正常的Sending data,没啥特别的。orm
好吧,要真的放大招了,再看看InnoDB事务状态:事务
------------ TRANSACTIONS ------------ Trx id counter 41220 Purge done for trx's n:o < 40288 undo n:o < 0 state: running but idle History list length 44 LIST OF TRANSACTIONS FOR EACH SESSION: ---TRANSACTION 422164356356832, not started 0 lock struct(s), heap size 1136, 0 row lock(s) ---TRANSACTION 40199, ACTIVE 1361 sec recovered trx ROLLING BACK 1 lock struct(s), heap size 1136, 0 row lock(s), undo log entries 3637207
注意到事务 40199 的状态是正在回滚中"ROLLING BACK",影响的undo log有3637207之多。ci
通过确认,缘由肯定了,事务 40199 在导入数据过程当中,导入过程发生了啥问题,对导入线程贱贱的按了CTRL+C。
就问你意不意外,惊不惊喜吧。。。
结果就悲剧了,导入线程的事务被回滚,因此才看到了那么多的undo log entries,总共是几千万数据啊,只不过咱们看到的时候还剩下300多万。
后来,又作了一次导入,此次又悲剧了,由于公司断网了,导入线程又一次被回滚(画外音,论远程操做时用screen的重要性)。
在上面这个例子中,可能有同窗会奇怪,为何导入还没结束,但却能看到表空间文件已经挺大的了,并且show table status也能看到rows值比较大。
和本案相似的场景还有,一个大表被执行全表delete了(不是直接truncate),这个事务产生的undo log还没被purge完毕,或者这个事务也被回滚了,在这个过程当中,执行 COUNT(*) 的结果可能和预期的不同。
程序员找出路仍是要尽可能提早进行职业规划和准备,千万不要说什么:“走一步,算一步”的话。在这个一睁眼就是竞争的时代,你能够放松休息,但别人会继续前进,不会等你。