关系数据库如何快速查询表的记录数

时间 2019-12-07

标签关系数据库如何快速查询记录栏目 SQL 繁體版

原文原文链接

在数据库中，不少人员习惯使用SELECT COUNT（*）、SELECT COUNT（1)、SELECT COUNT(COL)来查询一个表有多少记录，对于小表，这种SQL的开销倒不是很大，可是对于大表，这种查询表记录数的作法就是一个很是消耗资源了，并且效率不好。下面介绍一下SQL Server、 Oracle、MySQL中如何快速获取表的记录数。 mysql

SQL SERVER 数据库 sql

在SQL Server数据库中, 对象目录视图sys.partitions中有一个字段rows会记录表的记录数。咱们以AdventureWorks2014为测试数据库。数据库

 
  SELECT OBJECT_NAME(object_id)    AS Object_Name,  
   
         i.name                    AS Index_Name, 
   
         p.rows                    AS Table_Rows 
   
  FROM sys.partitions  p 
   
  LEFT JOIN sys.sysindexes i ON p.object_id = i.id AND  p.index_id = i.indid   
   
  WHERE 
   
       object_id = OBJECT_ID('TableName')

那么咱们还有一些疑问，咱们先来看看这些问题吧！ app

1：没有索引的表是否也能够使用上面脚本？ 函数

2：只有非汇集索引的堆表是否能够使用上面脚本？ 测试

3：有多个索引的表，是否记录数会存在不一致的状况？ spa

4：统计信息不许确的表，是否rows也会不许确 3d

5: 分区表的状况又是怎么样？ code

6：对象目录视图sys.partitions与sp_spaceused获取的表记录函数是否准确。 对象

以下所示，咱们先构造测试案例：

 
  IF EXISTS(SELECT 1 FROM sys.objects WHERE type='U' AND name='TEST_TAB_ROW') 
   
  BEGIN 
   
      DROP TABLE TEST_TAB_ROW; 
   
  END 
   
  IF NOT EXISTS(SELECT 1 FROM sys.objects WHERE type='U' AND name='TEST_TAB_ROW') 
   
  BEGIN 
   
          CREATE TABLE TEST_TAB_ROW 
   
          ( 
   
              ID        INT, 
   
              NAME      CHAR(200) 
   
          ) 
   
  END 
   
  GO 
   
  SET NOCOUNT ON; 
   
  BEGIN TRAN 
   
  DECLARE @Index INT =1; 
   
  WHILE @Index <= 100000 
   
  BEGIN 
   
      INSERT INTO TEST_TAB_ROW 
   
      VALUES(@Index, NEWID()); 
   
      SET @Index+=1; 
   
      IF (@Index % 5000)  = 0  
   
         BEGIN 
   
          IF @@TRANCOUNT > 0  
   
              BEGIN  
   
                  COMMIT; 
   
                  BEGIN TRAN 
   
              END 
   
      END 
   
  END 
   
  IF @@TRANCOUNT > 0  
   
  BEGIN  
   
      COMMIT; 
   
  END 
   
  GO

关于问题一、问题2，均可以使用上面脚本，以下测试所示：

 
  SELECT OBJECT_NAME(object_id)    AS Object_Name,  
   
         i.name                    AS Index_Name, 
   
         p.rows                    AS Table_Rows 
   
  FROM sys.partitions  p 
   
  LEFT JOIN sys.sysindexes i ON p.object_id = i.id AND  p.index_id = i.indid   
   
  WHERE 
   
       object_id = OBJECT_ID('dbo.TEST_TAB_ROW')

在表dbo.TEST_TAB_ROW 上建立非汇集索引后，查询结果以下所示：

 
  CREATE INDEX IX_TEST_TAB_ROW ON TEST_TAB_ROW(ID);

咱们插入500条记录，此时，这个数据量不足以触发统计信息更新，以下所示， Rows Sampled仍是1000000

 
  DECLARE @Index INT =1; 
   
  WHILE @Index <= 500 
   
  BEGIN 
   
      INSERT INTO TEST_TAB_ROW 
   
      VALUES(100000 +@Index, NEWID()); 
   
      SET @Index+=1; 
   
  END

以下所示，发现sys.partitions中的记录变成了100500了，可见rows这个值的计算不依赖统计信息。

固然，若是你用sp_spaceused，发现这里面的记录也是100500

sp_spaceused 'dbo.TEST_TAB_ROW'

关于问题3：有多个索引的表，是否记录数会存在不一致的状况？

答案：我的测试以及统计来看，暂时发现多个索引的状况下，sys.partitions中的rows记录数都是一致的。暂时没有发现不一致的状况，固然也不排除有特殊状况。

关于问题5: 分区表的状况又是怎么样？

答案：分区表和普通表没有任何区别。

关于问题6：对象目录视图sys.partitions与sp_spaceused获取的表记录函数是否准确？

答案：对象目录视图sys.partitions与sp_spaceused获取的表记录数是准确的。

ORACLE 数据库

在ORACLE数据库中，能够经过DBA_TABLES、ALL_TABLES、USER_TABLES视图查看表的记录数，不过这个值（NUM_ROWS）跟统计信息有很大的关系，有时候统计信息没有更新或采样比例会致使这个值不是很准确。

 
  SELECT OWNER     ,  
   
         TABLE_NAME,  
   
         NUM_ROWS  , 
   
         LAST_ANALYZED 
   
  FROM   DBA_TABLES  
   
  WHERE  OWNER = '&OWNER'  
   
         AND TABLE_NAME = '&TABLE_NAME';  
   
  SELECT OWNER, 
   
        TABLE_NAME, 
   
        NUM_ROWS  , 
   
        LAST_ANALYZED 
   
  FROM ALL_TABLES 
   
  WHERE OWNER   ='&OWNER' 
   
  AND TABLE_NAME='&TABLE_NAME'; 
   
  SELECT TABLE_NAME, 
   
         NUM_ROWS  , 
   
         LAST_ANALYZED 
   
  FROM USER_TABLES 
   
  WHERE TABLE_NAME='&TABLE_NAME'

更新统计信息后，就能获得准确的行数。因此若是须要获得正确的数据，最好更新目标表的统计信息，进行100%采样分析。对于分区表，那么就须要从dba_tab_partitions里面查询相关数据了。

SQL>execute dbms_stats.gather_table_stats(ownname => 'username', tabname =>'tablename', estimate_percent =>100, cascade=>true);

MySQL数据库

在MySQL中比较特殊，虽然INFORMATION_SCHEMA.TABLES也能够查到表的记录数，可是很是不许确。以下所示，即便使用ANALYZE TABLE更新了统计信息，从INFORMATION_SCHEMA.TABLES中获取的记录依然不许确。

 
  SELECT TABLE_ROWS  
   
  FROM INFORMATION_SCHEMA.TABLES 
   
  WHERE TABLE_NAME='table_name'

 
  mysql> SELECT TABLE_ROWS  
   
      -> FROM INFORMATION_SCHEMA.TABLES 
   
      -> WHERE TABLE_NAME='jiraissue' 
   
      -> ; 
   
  +------------+ 
   
  | TABLE_ROWS | 
   
  +------------+ 
   
  |      36487 | 
   
  +------------+ 
   
  1 row in set (0.01 sec) 
   
  mysql> select count(*) from jiraissue; 
   
  +----------+ 
   
  | count(*) | 
   
  +----------+ 
   
  |    36973 | 
   
  +----------+ 
   
  1 row in set (0.05 sec) 
   
  mysql> analyze table jiraissue; 
   
  +----------------+---------+----------+----------+ 
   
  | Table          | Op      | Msg_type | Msg_text | 
   
  +----------------+---------+----------+----------+ 
   
  | jira.jiraissue | analyze | status   | OK       | 
   
  +----------------+---------+----------+----------+ 
   
  1 row in set (1.41 sec) 
   
  mysql> SELECT TABLE_ROWS  
   
      -> FROM INFORMATION_SCHEMA.TABLES 
   
      -> WHERE TABLE_NAME='jiraissue'; 
   
  +------------+ 
   
  | TABLE_ROWS | 
   
  +------------+ 
   
  |      34193 | 
   
  +------------+ 
   
  1 row in set (0.00 sec) 
   
  mysql>

如上所示，MySQL这种查询表记录数的方法看来仍是有缺陷的。固然若是不是要求很是精确的值，这个方法也是不错的。

固然，上面介绍的SQL Server、Oracle、MySQL数据库中的方法，仍是有一些局限性的。例如，只能查询整张表的记录数，对于那些查询记录数带有查询条件（WHERE）这类SQL。仍是必须使用SELECT COUNT(*）这种方法。