在数据库中,不少人员习惯使用SELECT COUNT(*)、SELECT COUNT(1)、SELECT COUNT(COL)来查询一个表有多少记录,对于小表,这种SQL的开销倒不是很大,可是对于大表,这种查询表记录数的作法就是一个很是消耗资源了,并且效率不好。下面介绍一下SQL Server、 Oracle、MySQL中如何快速获取表的记录数。 mysql
SQL SERVER 数据库 sql
在SQL Server数据库中, 对象目录视图sys.partitions中有一个字段rows会记录表的记录数。咱们以AdventureWorks2014为测试数据库。 数据库
SELECT OBJECT_NAME(object_id) AS Object_Name,
i.name AS Index_Name,
p.rows AS Table_Rows
FROM sys.partitions p
LEFT JOIN sys.sysindexes i ON p.object_id = i.id AND p.index_id = i.indid
WHERE
object_id = OBJECT_ID('TableName')
那么咱们还有一些疑问,咱们先来看看这些问题吧! app
1:没有索引的表是否也能够使用上面脚本? 函数
2:只有非汇集索引的堆表是否能够使用上面脚本? 测试
3:有多个索引的表,是否记录数会存在不一致的状况? spa
4:统计信息不许确的表,是否rows也会不许确 3d
5: 分区表的状况又是怎么样? code
6:对象目录视图sys.partitions与sp_spaceused获取的表记录函数是否准确。 对象
以下所示,咱们先构造测试案例:
IF EXISTS(SELECT 1 FROM sys.objects WHERE type='U' AND name='TEST_TAB_ROW')
BEGIN
DROP TABLE TEST_TAB_ROW;
END
IF NOT EXISTS(SELECT 1 FROM sys.objects WHERE type='U' AND name='TEST_TAB_ROW')
BEGIN
CREATE TABLE TEST_TAB_ROW
(
ID INT,
NAME CHAR(200)
)
END
GO
SET NOCOUNT ON;
BEGIN TRAN
DECLARE @Index INT =1;
WHILE @Index <= 100000
BEGIN
INSERT INTO TEST_TAB_ROW
VALUES(@Index, NEWID());
SET @Index+=1;
IF (@Index % 5000) = 0
BEGIN
IF @@TRANCOUNT > 0
BEGIN
COMMIT;
BEGIN TRAN
END
END
END
IF @@TRANCOUNT > 0
BEGIN
COMMIT;
END
GO
关于问题一、问题2,均可以使用上面脚本, 以下测试所示:
SELECT OBJECT_NAME(object_id) AS Object_Name,
i.name AS Index_Name,
p.rows AS Table_Rows
FROM sys.partitions p
LEFT JOIN sys.sysindexes i ON p.object_id = i.id AND p.index_id = i.indid
WHERE
object_id = OBJECT_ID('dbo.TEST_TAB_ROW')
在表dbo.TEST_TAB_ROW 上建立非汇集索引后,查询结果以下所示:
CREATE INDEX IX_TEST_TAB_ROW ON TEST_TAB_ROW(ID);
咱们插入500条记录,此时,这个数据量不足以触发统计信息更新,以下所示, Rows Sampled仍是1000000
DECLARE @Index INT =1;
WHILE @Index <= 500
BEGIN
INSERT INTO TEST_TAB_ROW
VALUES(100000 +@Index, NEWID());
SET @Index+=1;
END
以下所示,发现sys.partitions中的记录变成了100500了,可见rows这个值的计算不依赖统计信息。
固然,若是你用sp_spaceused,发现这里面的记录也是100500
sp_spaceused 'dbo.TEST_TAB_ROW'
关于问题3:有多个索引的表,是否记录数会存在不一致的状况?
答案:我的测试以及统计来看,暂时发现多个索引的状况下,sys.partitions中的rows记录数都是一致的。暂时没有发现不一致的状况,固然也不排除有特殊状况。
关于问题5: 分区表的状况又是怎么样?
答案:分区表和普通表没有任何区别。
关于问题6:对象目录视图sys.partitions与sp_spaceused获取的表记录函数是否准确?
答案:对象目录视图sys.partitions与sp_spaceused获取的表记录数是准确的。
ORACLE 数据库
在ORACLE数据库中,能够经过DBA_TABLES、ALL_TABLES、USER_TABLES视图查看表的记录数,不过这个值(NUM_ROWS)跟统计信息有很大的关系,有时候统计信息没有更新或采样比例会致使这个值不是很准确。
SELECT OWNER ,
TABLE_NAME,
NUM_ROWS ,
LAST_ANALYZED
FROM DBA_TABLES
WHERE OWNER = '&OWNER'
AND TABLE_NAME = '&TABLE_NAME';
SELECT OWNER,
TABLE_NAME,
NUM_ROWS ,
LAST_ANALYZED
FROM ALL_TABLES
WHERE OWNER ='&OWNER'
AND TABLE_NAME='&TABLE_NAME';
SELECT TABLE_NAME,
NUM_ROWS ,
LAST_ANALYZED
FROM USER_TABLES
WHERE TABLE_NAME='&TABLE_NAME'
更新统计信息后,就能获得准确的行数。因此若是须要获得正确的数据,最好更新目标表的统计信息,进行100%采样分析。对于分区表,那么就须要从dba_tab_partitions里面查询相关数据了。
SQL>execute dbms_stats.gather_table_stats(ownname => 'username', tabname =>'tablename', estimate_percent =>100, cascade=>true);
MySQL数据库
在MySQL中比较特殊,虽然INFORMATION_SCHEMA.TABLES也能够查到表的记录数,可是很是不许确。以下所示,即便使用ANALYZE TABLE更新了统计信息,从INFORMATION_SCHEMA.TABLES中获取的记录依然不许确。
SELECT TABLE_ROWS
FROM INFORMATION_SCHEMA.TABLES
WHERE TABLE_NAME='table_name'
mysql> SELECT TABLE_ROWS
-> FROM INFORMATION_SCHEMA.TABLES
-> WHERE TABLE_NAME='jiraissue'
-> ;
+------------+
| TABLE_ROWS |
+------------+
| 36487 |
+------------+
1 row in set (0.01 sec)
mysql> select count(*) from jiraissue;
+----------+
| count(*) |
+----------+
| 36973 |
+----------+
1 row in set (0.05 sec)
mysql> analyze table jiraissue;
+----------------+---------+----------+----------+
| Table | Op | Msg_type | Msg_text |
+----------------+---------+----------+----------+
| jira.jiraissue | analyze | status | OK |
+----------------+---------+----------+----------+
1 row in set (1.41 sec)
mysql> SELECT TABLE_ROWS
-> FROM INFORMATION_SCHEMA.TABLES
-> WHERE TABLE_NAME='jiraissue';
+------------+
| TABLE_ROWS |
+------------+
| 34193 |
+------------+
1 row in set (0.00 sec)
mysql>
如上所示,MySQL这种查询表记录数的方法看来仍是有缺陷的。固然若是不是要求很是精确的值,这个方法也是不错的。
固然,上面介绍的SQL Server、Oracle、MySQL数据库中的方法,仍是有一些局限性的。例如,只能查询整张表的记录数,对于那些查询记录数带有查询条件(WHERE)这类SQL。仍是必须使用SELECT COUNT(*)这种方法。