Java中的random函数是如何实现的

时间 2019-11-10

标签 java random 函数如何实现栏目 Java 繁體版

原文原文链接

在Java中调用这个Math.Random()函数可以返回带正号的double值，取值范围是[0.0,1.0)的左闭右开区间，返回值是一个伪随机选择的数，在该范围内（近似）均匀分布。 html

1. random()函数的使用

Java的API中是这样描述Random()函数的: java

伪随机，也就是有规则的随机，所谓有规则的就是在给定种(seed)的区间内随机生成数字。算法
相同种子数的Random对象，相同次数生成的随机数字是彻底相同的。数据库
Random类中各方法生成的随机数字都是均匀分布的，也就是说区间内部的数字生成的概率均等。数组

下面是Java.util.Random()方法摘要 dom

protected int next(int bits)：生成下一个伪随机数。函数
boolean nextBoolean()：返回下一个伪随机数，它是取自此随机数生成器序列的均匀分布的boolean值。 ui
void nextBytes(byte[] bytes)：生成随机字节并将其置于用户提供的 byte 数组中。 this
double nextDouble()：返回下一个伪随机数，它是取自此随机数生成器序列的、在0.0和1.0之间均匀分布的 double值。 spa
float nextFloat()：返回下一个伪随机数，它是取自此随机数生成器序列的、在0.0和1.0之间均匀分布float值。
double nextGaussian()：返回下一个伪随机数，它是取自此随机数生成器序列的、呈高斯（“正态”）分布的double值，其平均值是0.0标准差是1.0。
int nextInt()：返回下一个伪随机数，它是此随机数生成器的序列中均匀分布的 int 值。
int nextInt(int n)：返回一个伪随机数，它是取自此随机数生成器序列的、在（包括和指定值（不包括）之间均匀分布的int值。
long nextLong()：返回下一个伪随机数，它是取自此随机数生成器序列的均匀分布的 long 值。
void setSeed(long seed)：使用单个 long 种子设置此随机数生成器的种子。

方法摘要也就这些，下面给几个例子：

1.生成[0,1.0)区间的小数：double d1 = r.nextDouble();

2.生成[0,5.0)区间的小数：double d2 = r.nextDouble() * 5;

3.生成[1,2.5)区间的小数：double d3 = r.nextDouble() * 1.5 + 1;

4.生成-231到231-1之间的整数：int n = r.nextInt();

5.生成[0,10)区间的整数：

int n2 = r.nextInt(10);//方法一

n2 = Math.abs(r.nextInt() % 10);//方法二

2. random()函数的实现

2.1 线性同余方程

Java中的Random类生成的是伪随机数，使用的是48-bit的种子，而后调用一个linear congruential formula线性同余方程

那么什么是线性同余方程呢？

古老的LCG(linear congruential generator)表明了最好最朴素的伪随机数产生器算法。主要缘由是容易理解，容易实现，并且速度快。

LCG 算法数学上基于公式：

X(n+1) = (a * X(n) + c) % m

其中，各系数为：

模m, m > 0
系数a, 0 < a < m
增量c, 0 <= c < m
原始值(种子) 0 <= X(0) < m
其中参数c, m, a比较敏感，或者说直接影响了伪随机数产生的质量。
通常而言，高LCG的m是2的指数次幂(通常2^32或者2^64,Java中是2^48)，由于这样取模操做截断最右的32或64位就能够了。多数编译器的库中使用了该理论实现其伪随机数发生器random()。

2.2 Java中的random()实现

刚刚说了，Java调用了一个线性同余方程来实现伪随机数的产生，具体的计算以下：

Xi = (Xi-1 * A + C ) mod M

其中A,C,M都是常数（通常会取质数）。当C=0时，叫作乘同余法。引出一个概念叫seed，它会被做为X0被代入上式中，而后每次调用random()函数都会用上一次产生的随机值来生成新的随机值。能够看出实际上用random()函数生成的是一个递推的序列，一切值都来源于最初的 seed。因此当初始的seed取同样的时候，获得的序列都相同。

下面Random()的两种构造方法

Random()：建立一个新的随机数生成器。
Random(long seed)：使用单个 long 种子建立一个新的随机数生成器。

咱们在构造Random对象的时候指定种子，若是是第一种构造方法，则默认当前系统时间对应的相对时间有关的数字做为种子数

须要说明的是：你在建立一个Random对象的时候能够给定任意一个合法的种子数，种子数只是随机算法的起源数字，和生成的随机数的区间没有任何关系。

public Random() {
        this(seedUniquifier() ^ System.nanoTime());
    }

private static long seedUniquifier() {
        // L'Ecuyer, "Tables of Linear Congruential Generators of
        // Different Sizes and Good Lattice Structure", 1999
        for (;;) {
            long current = seedUniquifier.get();
            long next = current * 181783497276652981L;
            if (seedUniquifier.compareAndSet(current, next))
                return next;
        }
    }

这里使用了System.nanoTime()方法来获得一个纳秒级的时间量，参与48位种子(为何要48位)的构成，而后还进行了一个很变态的运算——不断乘以181783497276652981L，直到某一次相乘先后结果相同(彷佛不是相同，可是其doc文档是这样说明的，若是有清楚的朋友能够下面留言说明)——来进一步增大随机性，这里的nanotime能够算是一个真随机数，不过有必要提的是，nanoTime和咱们经常使用的currenttime方法不一样，返回的不是从1970年1月1日到如今的时间，而是一个随机的数——只用来先后比较计算一个时间段，好比一行代码的运行时间，数据库导入的时间等，而不能用来计算今天是哪一天。

到目前为止，这个程序已经至少进行了三次随机：

一、得到一个长整形数做为“初始种子”（系统默认的是8682522807148012L(8682522807148012L与181783497276652981L的意义)）

二、不断与181783497276652981L相乘，直到某一次相乘先后数值相等

三、与系统随机出来的nanotime值做异或运算，获得最终的种子

protected int next(int bits) {
        long oldseed, nextseed;
        AtomicLong seed = this.seed;
        do {
            oldseed = seed.get();
            nextseed = (oldseed * multiplier + addend) & mask;
        } while (!seed.compareAndSet(oldseed, nextseed));
        return (int)(nextseed >>> (48 - bits));
    }

next()函数是random()的核心函数，也是对线性同余的实现。

(oldseed * multiplier + addend) & mask;

是否是形如 (Xi-1 * A + C ) mod M？只是mod变成了&，为何呢？

private static final long multiplier = 0x5DEECE66DL;
private static final long addend = 0xBL;
private static final long mask = (1L << 48) - 1;

其中multiplier和addend分别表明公式中的a和c，很好理解，但mask表明什么呢？其实，x & [(1L << 48)–1]与 x（mod 2^48）等价。解释以下：

而咱们将x对2^N取余操做但愿达到的目的能够理解为：

一、全部比2^N位（包括2^N那一位）高的位全都为0

二、全部比2^N低的位保持原样

因此x & [(1L << 48)–1]与 x（mod 2^48）等价。

接着让咱们看看nextInt()的实现。

public int nextInt() {
        return next(32);
}

默认调用next，生成32位的随机数。

public int nextInt(int n) {
        if (n <= 0)
            throw new IllegalArgumentException("n must be positive");

        if ((n & -n) == n)  // i.e., n is a power of 2
            return (int)((n * (long)next(31)) >> 31);

        int bits, val;
        do {
            bits = next(31);
            val = bits % n;
        } while (bits - val + (n-1) < 0);
        return val;
    }

显然，这里基本的思路仍是同样的，先调用next函数生成一个31位的随机数（int类型的范围），再对参数n进行判断，若是n刚好为2的方幂，那么直接移位就能够获得想要的结果；若是不是2的方幂，那么就关于n取余，最终使结果在[0,n)范围内。另外，do-while语句的目的应该是防止结果为负数。

那么为何(n & -n) == n能够判断一个数是否是2的次方幂？

众所周知，计算机中负数使用补码储存的：

2 ：0000 0010 -2 ：1111 1110

8 ：0000 1000 -8 ：1111 1000

18 ：0001 0010 -18 ：1110 1110

20 ：0001 0100 -20 ：1110 1100

补码有一个特性，就是能够对于两个相反数n与-n，有且只有最低一个为1的位数字相同且都为1，而更低的位全为0，更高的位各不相同。所以两数做按位与操做后只有一位为1，而能知足这个结果仍为n的只能是本来就只有一位是1的数，也就是刚好是2的次方幂的数了。

Reference：

1. http://blog.sina.com.cn/s/blog_93dc666c0101h3gd.html

2. http://www.cnblogs.com/xkfz007/archive/2012/03/27/2420154.html

3. http://t1174779123.iteye.com/blog/2037719

4. http://www.importnew.com/12460.html