分屡次累计随机出某指定整数(屡次随机整数,其和固定)的方法
Spads
Shane Loo Li
摘要
本文描述了同过 n 次取随机整数,使其总和为 m 的方法,并对该方法给出了数学证实。
正文
本文分为 5 个部分
---------- ---------- ---------- ----------
一、提出问题
二、解法程序
三、测试结果
四、测试程序
五、公式证实
【提出问题】
---------- ---------- ---------- ----------
有 n 次机会,每次随机一个整数。但愿这 n 个整数之和是 m ;该怎么随机呢?
对于编程语言,惯例是提供了随机函数 r() ,获得 [0, 1) 之间的一个随机浮点数。因此从编程角度来讲,随机一个整数,最多见的方式就是经过对 L * r() 向下取整来获取某一个范围内的整数。以上问题就转变成为了,如何得到合适的 L ,来知足 n 次随机的整数之和为 m 。
传统的作法,就是用 2 * m / n 来作这个 L 。问题是由于取整这个操做,让这种算法会产生比较大的偏差。具体偏差有多大,下边测试结果一栏会详细描述。
【解法程序】 —— 以 Java 程序为例
---------- ---------- ---------- ----------
/**
* <b>获取总量固定屡次随机的倍率</b><br/>
* 当程序须要经过必定次数随机,每次随机一个整数,最终获取总和必定的值,
* 可经过此方法得到随机倍率。<br/>
* 在获取此倍率 <code>randomLimit</code> 以后,每次随机时经过
* <code>(int) (new Random().nextDouble() * randomLimit)</code> 得到随机
* 结果。<br/><br/>
* 本方法的核心算法,基于证实了以下二个关系式:
* <pre>
* (int) (2 * totalNum / chanceCount) + 1 < randomLimit
* (int) (2 * totalNum / chanceCount) + 2 > randomLimit
* </pre>
* 具体推算方法,请见 Spads 的 Shane Loo Li 发表的日志。<br/>
* http://blog.csdn.net/shanelooli/article/details/10831811
* @param totalNum 最终但愿各随机值相加后的总量
* @param chanceCount 随机次数
* @return 每次随机,[0, 1) 标准随机值应该乘以的倍率
*/
static public double getRandomLimit(int totalNum, int chanceCount)
{
double calculateBase = 2.0 * totalNum / chanceCount;
int calculateBaseInt = (int) calculateBase;
double randomLimit = (calculateBaseInt + 2) * (calculateBaseInt + 1)
/ (2 * calculateBaseInt - calculateBase + 2);
return randomLimit;
}
【测试结果】
---------- ---------- ---------- ----------
目标总和为 5000000
随机次数 20000
简易方法: 实际随机数的总和 = 4993051, 偏差 = 0.1389%
Spads Shane的新方法: 实际随机数的总和 = 4997315, 偏差 = 0.0537%
随机次数 50000
简易方法: 实际随机数的总和 = 4946686, 偏差 = 1.10661%
Spads Shane的新方法: 实际随机数的总和 = 4992772, 偏差 = 0.1445%
随机次数 150000
简易方法: 实际随机数的总和 = 4915701, 偏差 = 1.16858%
Spads Shane的新方法: 实际随机数的总和 = 5003719, 偏差 = 0.0743%
随机次数 500000
简易方法: 实际随机数的总和 = 4758806,
偏差 = 4.48234%
Spads Shane的新方法: 实际随机数的总和 = 4997350, 偏差 = 0.0530%
随机次数 1000000
简易方法: 实际随机数的总和 = 4502306,
偏差 = 9.99529%
Spads Shane的新方法: 实际随机数的总和 = 5003257, 偏差 = 0.0651%
随机次数 3000000
简易方法: 实际随机数的总和 = 3602468,
偏差 = 27.279479%
Spads Shane的新方法: 实际随机数的总和 = 4999469, 偏差 = 0.0106%
随机次数 5000000
简易方法: 实际随机数的总和 = 2500655,
偏差 = 49.499820%
Spads Shane的新方法: 实际随机数的总和 = 5000972, 偏差 = 0.0194%
随机次数 8000000
简易方法: 实际随机数的总和 = 1598759,
偏差 = 68.680180%
Spads Shane的新方法: 实际随机数的总和 = 4996882, 偏差 = 0.0623%
随机次数 13000000
简易方法: 实际随机数的总和 = 0,
偏差 = 100.0000%
Spads Shane的新方法: 实际随机数的总和 = 4999994, 偏差 = 0.0001%
随机次数 20000000
简易方法: 实际随机数的总和 = 0,
偏差 = 100.0000%
Spads Shane的新方法: 实际随机数的总和 = 4995380, 偏差 = 0.0924%
能够见到,不管多少次随机,简易方法比 Spads Shane 的新方法偏差都要大。当随机次数较多时,简易方法偏差显著增长;若是随机次数和最终所需的和达到同一个数量级,简易方法的偏差就会极大,使得这种方法没法再使用。
以上测试结果报告,由下边给出的测试程序直接生成。
【测试程序】
---------- ---------- ---------- ----------
public void testRandomLimit()
{
// 指定屡次随机的整数加起来的预期总和,并显示
int totalNum = 5000000;
System.out.println("目标总和为 " + totalNum);
// 随机次数
int[] chanceCounts = {
20000, 50000, 150000, 500000, 1000000, 3000000,
5000000, 8000000, 13000000, 20000000
};
// 二种方法
String[] reportTitles = {"\n简易方法:\t\t", "\nSpads Shane的新方法:\t"};
double[] randomLimits = new double[2];
// 一个随机数生成对象便可解决问题,不必重复生成此对象
Random ran = new Random();
// 遍历各类随机次数,分别测评
for (int index, methodIndex, chanceIndex = -1;
++chanceIndex != chanceCounts.length; )
{
// 获取本次测评的随机次数,并显示
StringBuilder report = new StringBuilder();
int chanceCount = chanceCounts[chanceIndex];
report.append("\n随机次数 ").append(chanceCount);
// 分别指定传统方法的随机倍率,和 Spads Shane 新方法的随机倍率
randomLimits[0] = 2.0 * totalNum / chanceCount;
randomLimits[1] = getRandomLimit(totalNum, chanceCount);
// 分别测评二种方法,最终显示结果报告
for (methodIndex = -1; ++methodIndex != 2; )
{
report.append(reportTitles[methodIndex]);
int realCount = 0;
double randomLimit = randomLimits[methodIndex];
for (index = -1; ++index != chanceCount; )
realCount += (int) (ran.nextDouble() * randomLimit);
report.append("实际随机数的总和 = ").append(realCount);
double error = Math.abs(realCount - totalNum) / (double) totalNum;
int percent = (int) (error * 100);
report.append(", 偏差 = ").append(percent).append('.');
String decimalStr = "0000";
if (percent != 100)
{
decimalStr = String.valueOf((int) (error * 1000000) - percent);
if (decimalStr.length() < 4)
report.append("0000".substring(decimalStr.length()));
}
report.append(decimalStr).append('%');
}
System.out.println(report.toString());
}
}
【公式证实】
---------- ---------- ---------- ----------
以前咱们看到,程序以一个并不太复杂的四则运算式,经过目标总和 m 与随机次数 n ,获得了随机倍率参量 L 。L 自身将是一个大于 1 的实数。由于若是 L <= 1 ,则 int(L * r()) 恒为 0 。
设 Z = 2m / n
L = [int(Z) + 1][int(Z) + 2] / [2int(Z) - Z + 2]
其中 int(x) 为向下取整函数。
接下来,咱们来证实这个公式的正确性。
一、经过几率核心定律,求得 L 与 m, n 的关系
几率核心定律,认为有 p 几率发生的事情,在尝试屡次后,其发生比例趋近于 p 。
设用 L * r() 取随机数,平均结果为 R ,可知 R * n = m ,即 2R = Z。
这里 r() 为产生 [0, 1) 随机数的函数。
咱们老是能够把 L 表示成 a + b ,其中 a = int(L),b∈[0, 1) 。由于 L > 1 ,因此 a >= 1 。
因而可以得到用 L, a 表示的 R 的表达式;其中最重要的一点,就是由于取整这种运算的存在,因此随机出 a 的几率,要小于其他整数。
R = { ∑(0 * 1/L) + (1 * 1/L) + (2 * 1/L) + ... + [(a - 1) * 1/L] } + a * (L - a)/L
根据等差数列求和公式,求 R 的表达式具体形式
R = [0/L + (a - 1)/L] * a / 2 + a * (L - a) / L
Z = 2R
= [a(a - 1) + 2a(L - a)] / L
= (2aL - a^2 - a) / L
二、证实 a = int(Z) + 1 ,开始的推论
由于 a = L - b ,b∈[0, 1) ,因此为证实 a = int(Z) + 1 ,只须要证实以下二个关系式:
int(Z) + 1 < L ①
int(Z) + 2 > L ②
为此,咱们须要用能够肯定范围的已知量,来表示 int(Z) 。
咱们老是能够把 Z 表示成 int(Z) + c ,其中 c∈[0, 1) 。
根据以前的推论,咱们知道 Z = (2aL - a^2 - a) / L
将 L = a + b ,b∈[0, 1) 代入上式
Z = [2a(a + b) - a^2 - a] / (a + b)
= (a^2 + 2ab - a) / (a + b)
= [(a + b)^2 - b^2 - a] / (a + b)
= a + b - (a + b^2) / (a + b)
至此,咱们看到 Z = int(Z) + c = a + b - (a + b^2) / (a + b)
若是 b - (a + b^2) / (a + b) 是一个可以把绝对值范围控制在 1 之内的量,就能够经过取整原则,求得用 a, b 表示的 c 的表达式。
三、证实 b - (a + b^2) / (a + b) ∈ [-1, 0)
先证实
b - (a + b^2) / (a + b) < 0
↑
b < (a + b^2) / (a + b)
↑ ∵ a + b = L > 1 > 0
b(a + b) < a + b^2
↑
ab + b^2 < a + b^2
↑
ab < a
↑ ∵ a >= 1 > 0
b < 1
原题得证
再证实
b - (a + b^2) / (a + b) >= -1
↑
(a + b^2) / (a + b) - b <= 1
↑
(a + b^2) / (a + b) <= 1 + b
↑ ∵ a + b = L > 1 > 0
a + b^2 <= (a + b)(1 + b)
↑
a + b^2 <= a + ab + b + b^2
↑
0 <= ab + b
原题得证
所以,可知 b - (a + b^2) / (a + b) ∈ [-1, 0)
四、证实 a = int(Z) + 1 ,原题得证
根据上边的结论,
Z = int(Z) + c = a + b - (a + b^2) / (a + b)
int(Z) + c = a - 1 + [1 + b - (a + b^2) / (a + b)]
由于 b - (a + b^2) / (a + b) ∈ [-1, 0)
因此 1 + b - (a + b^2) / (a + b) ∈ [0, 1)
证实,若是 A + B = C + D ,A, C 为整数,B, D∈[0, 1) ,那么 B = D
∵ A + B = C + D
∴ A - C = D - B
若 A - C = 0 ,则 B = D
若 A - C >= 1 ,则 D - B = A - C >= 1
↑
D >= 1 + B
∵ D < 1 且 B >= 0
∴ D >= 1 + B 不成立。
∴ A - C >= 1 不成立。
∴ B = D 且 A = C
所以可知 c = 1 + b - (a + b^2) / (a + b) 且 int(Z) = a - 1
a = int(Z) + 1
五、求得 L 用 Z 的表达式
Z = (2aL - a^2 - a) / L
ZL = 2int(Z)L + 2L - [int(Z) + 1]^2 - int(Z) - 1
ZL - 2L - 2int(Z)L = -1 - [int(Z) + 1]^2 - int(Z)
L * [2 + 2int(Z) - Z] = [int(Z) + 1]^2 + int(Z) + 1
L = [int(Z)^2 + 2int(Z) + 1 + int(Z) + 1] / [2 + 2int(Z) - Z]
L = [int(Z)^2 + 3int(Z) + 2] / [2int(Z) - Z + 2]
L = [int(Z) + 1][int(Z) + 2] / [2int(Z) - Z + 2]
本文还发表于在其它网站
CSDN :
http://blog.csdn.net/shanelooli/article/details/10831811
ITeye :
http://surmounting.iteye.com/blog/1935022
51CTO :
http://shanelooli.blog.51cto.com/5523233/1286679