转载来源:http://www.orafans.org/2006/09/oracle-random-record.htmlhtml
转载来源:http://kb.cnblogs.com/a/1443619/java
1、Oracle取随机数据
一、Oracle访问数据的基本方法:
1)、全表扫描(Full table Scan):执行全表扫描,Oracle读表中的全部记录,考查每一行是否知足WHERE条件。Oracle顺序的读分配给该表的每个数据块,且每一个数据块Oracle只读一次.这样全表扫描可以受益于多块读.
2)、采样表扫描(sample table scan):扫描返回表中随机采样数据,这种访问方式须要在FROM语句中包含SAMPLE选项或者SAMPLE BLOCK选项.
注:从Oracle8i开始Oracle提供采样表扫描特性
二、使用sample得到随机结果集
2.一、语法: SAMPLE [ BLOCK ](sample_percent)[ SEED (seed_value) ]
SAMPLE选项:表示按行采样来执行一个全表扫描,Oracle从表中读取特定百分比的记录,并判断是否知足WHERE子句以返回结果。
BLOCK: 表示使用随机块例举而不是随机行例举。
sample_percent:是随机获取一张表中记录的百分比。好比值为10,那就是表中的随机的百分之10的记录。
值必须大于等于.000001,小于100。
SEED:表示从哪条记录返回,相似于预先设定例举结果,于是每次返回的结果都是固定的。该值必须介于0和4294967295之间。
2.二、举例说明
建立测试临时表: mysql
SQL>create table zeeno as select * from dba_objects;
1)、sample(sample_percent): linux
-- 从表zeeno中“全表扫描”随机抽取10%的记录,随机查询5条记录 SQL>select object_name from zeeno sample(10) where rownum<6; OBJECT_NAME -------------------------------------------------------------------------------- UET$ VIEW$ I_SUPEROBJ2 TRIGGERCOL$ I_VIEW1 SQL> / OBJECT_NAME -------------------------------------------------------------------------------- I_FILE1 IND$ CLU$ FET$ I_COBJ#
2)、sample block(sample_percent) sql
-- 从表zeeno中“采样表扫描”随机抽取10%的记录,随机查询5条记录 SQL> select object_name from zeeno sample block(10) where rownum<6; OBJECT_NAME -------------------------------------------------------------------------------- URIFACTORY DBMS_XMLGEN DBMS_XMLGEN DBMS_XMLSTORE DBMS_XMLSTORE
3)、sample block(sample_percent) seed(seed_value) 数据库
-- 使用seed,返回固定的结果集。从表zeeno中“采样表扫描”随机抽取10%的记录,随机查询5条记录。 SQL> select object_name from zeeno sample(10) seed(10) where rownum<6; OBJECT_NAME -------------------------------------------------------------------------------- UET$ I_CON1 I_FILE2 FET$ I_COL1 SQL> select object_name from zeeno sample(10) seed(10) where rownum<6; OBJECT_NAME -------------------------------------------------------------------------------- UET$ I_CON1 I_FILE2 FET$ I_COL1
注意如下几点:windows
1.sample只对单表生效,不能用于表链接和远程表
2.sample会使SQL自动使用CBO oracle
三、使用DBMS_RANDOM包
DBMS_RANDOM有两种主要的使用方法分别是:DBMS_RANDOM.VALUE()和DBMS_RANDOM.RANDOMdom
3.一、取随机数函数
SQL> select dbms_random.value() from dual; DBMS_RANDOM.VALUE() ------------------- 0.146123095968043 SQL> select dbms_random.value() from dual; DBMS_RANDOM.VALUE() ------------------- 0.90175764902345
SQL> select dbms_random.value(1,10) from dual; DBMS_RANDOM.VALUE(1,10) ----------------------- 9.86601968210438 SQL> select dbms_random.value(1,10) from dual; DBMS_RANDOM.VALUE(1,10) ----------------------- 3.43475105499398
3.二、举例说明
SQL> select * from (select object_name from zeeno order by dbms_random.random) where rownum<6; OBJECT_NAME -------------------------------------------------------------------------------- /6dd0fe0e_CertificateCertifica /cf5224d7_SunJSSE_a4 KU$_PARSED_ITEMS javax/swing/text/IconView oracle/xml/jdwp/XSLJDWPString SQL> select * from (select object_name from zeeno order by dbms_random.random) where rownum<6; OBJECT_NAME -------------------------------------------------------------------------------- java/io/ObjectOutputStream$1 sun/security/krb5/KrbAsReq /2d52a21c_Last SYS_YOID0000006594$ /308fbfa1_BeanContextServices
SQL> select * from (select object_name from zeeno order by trunc(dbms_random.value(1,3))) where rownum<6; OBJECT_NAME -------------------------------------------------------------------------------- ICOL$ C_COBJ# PROXY_ROLE_DATA$ I_OBJ# UET$ SQL> select * from (select object_name from zeeno order by trunc(dbms_random.value(1,3))) where rownum<6; OBJECT_NAME -------------------------------------------------------------------------------- ICOL$ UNDO$ I_PROXY_ROLE_DATA$_1 I_CDEF2 UET$
SQL> select trunc(dbms_random.value(0, 1000)) randomNum from dual; --(0-1000的整数) RANDOMNUM ---------- 790 SQL> select dbms_random.value(0, 1000) randomNum from dual; --(0-1000的浮点数) RANDOMNUM ---------- 997.876726
四、使用内部函数sys_guid()
SQL> select * from (select OBJECT_NAME from zeeno order by sys_guid()) where rownum < 6; OBJECT_NAME -------------------------------------------------------------------------------- /6bedadd5_KeyManagerFactory1 /ffd795c8_AddCRIF TABLE_EXPORT_OBJECTS /278cd3a4_CGParselet KU$_REFCOL_T SQL> select * from (select OBJECT_NAME from zeeno order by sys_guid()) where rownum < 6; OBJECT_NAME -------------------------------------------------------------------------------- sun/awt/InputMethodSupport V_$RESTORE_POINT COLORSLIST java/util/WeakHashMap$Entry DBMSOUTPUT_LINESARRAY
注:
在使用sys_guid() 这种方法时,有时会获取到相同的记录,即和前一次查询的结果集是同样的,查找相关资料,有些说是和操做系统有关,在windows平台下正常,获取到的数据是随机的,而在linux等平台下始终是相同不变的数据集,有些说是由于sys_guid()函数自己的问题,即sys_guid()会在查询上生成一个16字节的全局惟一标识符,这个标识符在绝大部分平台上由一个宿主标识符和进程或进程的线程标识符组成,这就是说,它极可能是随机的,可是并不表示必定是百分之百的这样。
因此,为确保在不一样的平台每次读取的数据都是随机的,咱们大多采用使用sample函数或者DBMS_RANDOM包得到随机结果集,其中使用sample函数更经常使用,由于其查询时缩小了查询范围,在查询大表,且要提取数据不是很很少的状况下,会对查询速度上有明显的提升。
2、其余数据库随机取出n条记录:
一、SqlServer中随机提取数据库记录
select top n * from 表 order by newid()
--------------------------------------------------------------------------------
select top 10 * from tablename order by NEWID()
select top 10 * from tablename order by NEWID()
二、mysql中随机提取数据库记录
Select * From 表 order By rand() Limit n
-------------------------------------------------------------------------------
select * from tablename order by rand() limit 10
select * from tablename order by rand() limit 10
三、Access中随机提取数据库记录
Select top n * FROM 表 orDER BY Rnd(id)
-------------------------------------------------------------------------------SELECT top 10 * FROM tablename ORDER BY Rnd(FId) SELECT top 10 * FROM tablename ORDER BY Rnd(FId)FId:为你当前表的ID字段名