几率论是研究随机现象数量规律的数学分支。随机现象是相对于决定性现象而言的。在必定条件下必然发生某一结果的现象称为决定性现象。例如在标准大气压下,纯水加热到100℃时水必然会沸腾等。随机现象则是指在基本条件不变的状况下,每一次试验或观察前,不能确定会出现哪一种结果,呈现出偶然性。例如,掷一硬币,可能出现正面或反面。随机现象的实现和对它的观察称为随机试验。随机试验的每一可能结果称为一个基本事件,一个或一组基本事件统称随机事件,或简称事件。典型的随机试验有掷骰子、扔硬币、抽扑克牌以及轮盘游戏等。
事件的几率是衡量该事件发生的可能性的量度。虽然在一次随机试验中某个事件的发生是带有偶然性的,但那些可在相同条件下大量重复的随机试验却每每呈现出明显的数量规律。
传统几率
传统几率又叫拉普拉斯几率,由于其定义是由法国数学家
拉普拉斯提出的。若是一个随机试验所包含的单位事件是有限的,且每一个单位事件发生的可能性均相等,则这个随机试验叫作拉普拉斯试验。在拉普拉斯试验中,事件A在事件空间S中的几率P(A)为:
例如,在一次同时掷一个硬币和一个骰子的随机试验中,假设事件A为得到国徽面且点数大于4,那么事件A的几率应该有以下计算方法:S={(国徽,1点),(数字,1点),(国徽,2点),(数字,2点),(国徽,3点),(数字,3点),(国徽,4点),(数字,4点),(国徽,5点),(数字,5点),(国徽,6点),(数字,6点)},A={(国徽,5点),(国徽,6点)},按照拉普拉斯定义,A的几率为2/12=1/6,注意到在拉普拉斯试验中存在着若干的疑问,在现实中是否存在着这样一个试验,其单位事件的几率具备精确的相同的几率值,由于人们不知道,硬币以及骰子是否"完美",即骰子制造的是否均匀,其重心是否位于正中心,以及轮盘是否倾向于某一个数字等等。尽管如此,传统几率在实践中被普遍应用于肯定事件的
几率值,其理论根据是:若是没有足够的论据来证实一个事件的几率大于另外一个事件的几率,那么能够认为这两个事件的几率值相等。 若是仔细观察这个定义会发现拉普拉斯用几率解释了几率,定义中用了"相同的可能性"(原文是égalementpossible)一词,其实指的就是"相同的几率"。这个定义也并无说出,到底什么是几率,以及如何用数字来肯定几率。在现实生活中也有一系列问题,不管如何不能用传统几率定义来解释,好比,人寿保险公司没法肯定一个50岁的人在下一年将死去的几率等。
公理化定义
如何定义几率,如何把几率论创建在严格的
逻辑基础上,是几率理论发展的困难所在,对这一问题的探索一直持续了3个世纪。20世纪初完成的
勒贝格测度与积分理论及随后发展的抽象测度和积分理论,为
几率公理体系的创建奠基了基础。在这种背景下,苏联数学家
柯尔莫哥洛夫1933年在他的《几率论基础》一书中第一次给出了几率的
测度论的定义和一套严密的
公理体系。他的
公理化方法成为现代几率论的基础,使几率论成为严谨的数学分支,对几率论的迅速发展起了积极的做用。
如下是公理化定义:
设随机实验E的
样本空间为Ω。若按照某种方法,对E的每一事件A赋于一个实数P(A),且知足如下公理:
1°非负性:P(A)≥0;
2°规范性:P(Ω)=1;
3°可列(彻底)可加性:对于两两互不相容的可列无穷多个事件A1,A2,……,An,……,有
,则称实数P(A)为事件A的几率。
统计定义
设随机事件A在n次重复试验中发生的次数为nA,若当试验次数n很大时,频率nA/n稳定地在某一数值p的附近摆动,且随着试验次数n的增长,其摆动的幅度愈来愈小,则称数p为随机事件A的几率,记为P(A)=p。
相关事例
人们广泛认为,对将要发生的机率的一种很差的感受,或者说不安全感(俗称“点背”)是实际存在的。下面列出的几个例子能够形象阐述人们有时对机率存在的错误的认识:
几率论
1.六合彩:在六合彩(49选6)中,一共有13983816种可能性(参阅
组合数学),广泛认为,若是每周都买一个不相同的号,最晚能够在13983816/52(周)=268919年后得到头等奖。事实上这种理解是错误的,由于每次中奖的机率是相等的,中奖的可能性并不会由于时间的推移而变大。
2.生日悖论:在一个足球场上有23我的(2×11个运动员和1个裁判员),难以想象的是,在这23人当中至少有两我的的生日是在同一天的机率要大于50%。
3.轮盘游戏:在游戏中玩家广泛认为,在连续出现屡次红色后,出现黑色的机率会愈来愈大。这种判断也是错误的,即出现黑色的机率每次是相等的,由于球自己并无“记忆”,它不会意识到之前都发生了什么,其机率始终是18/37。
4.三门问题:在电视台举办的猜隐藏在门后面的汽车的游戏节目中,在参赛者的对面有三扇关闭的门,其中只有一扇门的后面有一辆汽车,其它两扇门后是山羊。游戏规则是,参赛者先选择一扇他认为其后面有汽车的门,可是这扇门仍保持关闭状态,紧接着主持人打开没有被参赛者选择的另外两扇门中后面有山羊的一扇门,这时主持人问参赛者,要不要改变主意,选择另外一扇门,以使得赢得汽车的机率更大一些?
正确结果是,若是参赛者改变初衷,他的中奖几率将变成2/3。由于打开山羊门的那一刹那,原本的选择结果已经从1/3概率变到了1/2概率,若是改变初衷此时将是1/2中奖的概率。
有三种可能的状况,所有都有相等的可能性(1/3)︰参赛者挑山羊一号,主持人挑山羊二号。转换将赢得汽车。参赛者挑山羊二号,主持人挑山羊一号。转换将赢得汽车。参赛者挑汽车,主持人挑两头山羊的任何一头。转换将失败。在头两种状况,参赛者能够经过转换选择而赢得汽车。第三种状况是惟一一种参赛者经过保持原来选择而赢的状况。由于三种状况中有两种是经过转换选择而赢的,因此经过转换选择而赢的几率是2/3。[1]
事件
单位事件、事件空间、随机事件
在一次随机试验中可能发生的惟一的,且相互之间独立的结果被称为单位事件,用e表示。在随机试验中可能发生的全部单位事件的集合称为事件空间,用S来表示。例如在一次掷骰子的随机试验中,若是用得到的点数来表示单位事件,那么一共可能出现6个单位事件,则事件空间能够表示为S={1,2,3,4,5,6}。 上面的事件空间是由可数有限单位事件组成,事实上还存在着由可数无限以及不可数单位事件组成的事件空间,好比在一次直到得到
国徽面朝上的随机掷硬币试验中,其事件空间由可数无限单位事件组成,表示为:S={国,数国,数数国,数数数国,数数数数国,···},注意到在这个例子中"数数数国"是单位事件。将两根筷子随意扔向桌面,其静止后所造成的
交角假设为α,这个随机试验的事件空间的组成能够表示为
。
随机事件是事件空间S的
子集,它由事件空间S中的单位元素构成,用大写字母A,B,C...表示。例如在掷两个骰子的随机试验中,设随机事件A="得到的点数和大于10",则A能够由下面3个单位事件组成:A={(5,6),(6,5),(6,6)}。 若是在随机试验中事件空间中的全部可能的单位事件都发生,这个事件被称为
必然事件,表示为
;相应的若是事件空间里不包含任何一个单位事件,则称之为不可能事件,表示为
。
事件的计算
由于事件在必定程度上是以
集合的含义定义的,所以能够把集合
计算方法直接应用于事件的计算,也就是说,在计算过程当中,能够把事件看成集合来对待。
A的补集
不属于A的事件发生
|
联集A∪B
或者A或者B或者A,B同时发生
|
交集A∩B
事件A,B同时发生
|
差集A\B
不属于B的A事件发生
|
空集A∩B=∅
A,B事件不一样时发生
|
子集B⊆A
如A发生,则B也必定发生
|
在轮盘游戏中假设A表明事件“球落在红色区域”,B表明事件"球落在黑色区域",C表明事件"球落在绿色区域",由于事件A和B没有共同的单位事件,所以可表示为几率P(AB)=0。
注意到事件A和B并非互补的关系,由于在整个事件空间S中还有一个单位事件C,其即不是红色也不是黑色,而是绿色,所以A,B的补集应该分别表示以下:
以及
。
条件几率
一事件A在一事件B肯定发生后会发生的几率称为B给之A的
条件几率;其数值为
(当
时)。若B给之A的条件几率和A的几率相同时,则称A和B为
独立事件。
几率论
且A和B的此一关系为对称的,这能够由一同价叙述:“当A和B为独立事件时,P(A∩B)=P(A)P(B)”看出。
须要说起的是下面将要介绍的9个计算几率的定理与上面已经说起的事件的计算没有关系,全部关于几率的定理均由几率的3个公理得来,同时适用于包括拉普拉斯几率和统计几率在内的全部几率理论。
定理1
(互补法则)
与A互补事件的几率始终是1-P(A)。
第一次旋转红色不出现的几率是19/37,按照
乘法法则,第二次也不出现红色的几率是
,所以在这里互补几率就是指在两次连续旋转中至少有一次是红色的几率,为
定理2
不可能事件的几率为零。
证实: Q和S是互补事件,按照公理2有P(S)=1,再根据上面的定理1获得P(Q)=0
定理3
若是A1...An事件不能同时发生(为互斥事件),并且若干事件A1,A2,...An∈S每两两之间是空集关系,那么这些全部事件
集合的几率等于单个事件的几率的和。
定理4
定理5
(任意事件加法法则)
对于事件空间S中的任意两个事件A和B,有以下定理: 几率
定理6
(乘法法则) 事件A,B同时发生的几率是:
,前提为事件A,B有必定关联。
定理7
(无关事件乘法法则)
两个不相关联的事件A,B同时发生的几率是:注意到这个定理其实是定理6(乘法法则)的特殊状况,若是事件A,B没有联系,则有P(A|B)=P(A),以及P(B|A)=P(B)。观察一下轮盘游戏中两次连续的旋转过程,P(A)表明第一次出现红色的几率,P(B)表明第二次出现红色的几率,能够看出,A与B没有关联,利用上面提到的公式,连续两次出现红色的几率为:
忽视这必定理是形成许多玩家失败的根源,广泛认为,通过连续出现若干次红色后,黑色出现的几率会愈来愈大,事实上两种颜色每次出现的几率是相等的,以前出现的红色与以后出现的黑色之间没有任何联系,由于球自己并无"记忆",它并不"知道"之前都发生了什么。
统计几率是创建在频率理论基础上的,分别由英国逻辑学家约翰(John Venn,1834-1923)和
奥地利数学家理查德(Richard VonMises,1883-1953)提出,他们认为,得到一个事件的几率值的惟一方法是经过对该事件进行100次,1000次或者甚至10000次的先后相互独立的n次随机试验,针对每次试验均记录下绝对频率值和相对频率值hn(A),随着试验次数n的增长,会出现以下事实,即相对频率值会趋于稳定,它在一个特定的值上下浮动,也便是说存在着一个
极限值P(A),相对频率值趋向于这个极限值。
例如,若想知道在一次掷骰子的随机试验中得到6点的几率值能够对其进行3000次先后独立的扔掷试验,在每一次试验后记录下出现6点的次数,而后经过计算相对频率值能够获得趋向于某一个数的统计几率值。
扔掷数
|
得到6点的绝对频率
|
得到6点的相对频率
|
1
|
1
|
1.00000
|
2
|
1
|
0.50000
|
3
|
1
|
0.33333
|
4
|
1
|
0.25000
|
5
|
2
|
0.40000
|
10
|
2
|
0.20000
|
20
|
5
|
0.25000
|
100
|
12
|
0.12000
|
200
|
39
|
0.19500
|
300
|
46
|
0.15333
|
400
|
72
|
0.18000
|
500
|
76
|
0.15200
|
600
|
102
|
0.17000
|
700
|
120
|
0.17143
|
1000
|
170
|
0.17000
|
2000
|
343
|
0.17150
|
3000
|
560
|
0.16867
|
上面提到的这个有关相对频率的经验值又被称为
大数定律,是频率理论学家定义几率论的基础。然而没有人能够将骰子无限的扔下去,所以在实践中也就没法有力的证实大数定律,许多来自数学理论的论证至今也没有取得成功。尽管如此,统计几率在今天的实践中具备重要意义,它是
数理统计的基础。
n个事件H1,H2,...Hn互相间独立,且共同组成整个事件空间S,即
,并且
。这时A的几率能够表示为
例如,一个随机试验工具由一个骰子和一个柜子中的三个抽屉组成,抽屉1里有14个
白球和6个黑球,抽屉2里有2个白球和8个黑球,抽屉3里有3个白球和7个黑球,试验规则是首先掷骰子,若是得到小于4点,则抽屉1被选择,若是得到4点或者5点,则抽屉2被选择,其余状况选择抽屉3。而后在选择的抽屉里随机抽出一个球,最后抽出的这个球是白球的几率是:
P(白)=P(白|抽1)·P(抽1)+P(白|抽2)·P(抽2)+P(白|抽3)·P(抽3)
=(14/20)·(3/6)+(2/10)·(2/6)+(3/10)·(1/6)
=28/60=0.4667
从例子中可看出,彻底几率特别适合于分析具备
多层结构的随机试验的状况。
贝叶斯定理由英国数学家贝叶斯(Thomas Bayes,1702-1761)发展,用来描述两个条件几率之间的关系,好比P(A|B)和P(B|A)。按照定理6的乘法法则,
,能够马上导出贝叶斯定理:
如上公式也可变形为例如:
。[2]
一座别墅在过去的20年里一共发生过2次被盗,别墅的主人有一条狗,狗平均每周晚上叫3次,在盗贼入侵时狗叫的几率被估计为0.9,问题是:在狗叫的时候发生入侵的几率是多少?
人们假设A事件为狗在晚上叫,B为盗贼入侵,则
,
,
,按照公式很容易得出结果:
。
另外一个例子,现分别有A,B两个容器,在容器A分别有7个红球和3个白球,在容器B里有1个红球和9个白球,现已知从这两个容器里任意抽出了一个球,且是红球,问这个红球是来自容器A的几率是多少?
假设已经抽出红球为事件B,从容器A里抽出球为事件A,则有:
,
,
,按照公式,则有:
。
虽然几率论最先产生于17世纪,然而其公理体系却在20世纪的20至30年代才创建起来并获得迅速发展,在过去的半个世纪里几率论在愈来愈多的新兴领域显示了它的应用性和实用性,例如:物理、化学、生物、医学、心理学、社会学、政治学、教育学,经济学以及几乎全部的
工程学等领域。
特别值得一提的是,几率论是今天数理统计的基础,其结果常被用作问卷调查的分析资料,并且也用于对经济前景进行预测。