其中P(A|B)是在 B 发生的状况下 A 发生的可能性。code
在贝叶斯定理中,每一个名词都有约定俗成的名称:orm
P(A)是 A 的先验几率,之因此称为“先验”是由于它不考虑任何 B 方面的因素。 P(A|B)是已知 B 发生后 A 的条件几率,也因为得自 B 的取值而被称做 A 的后验几率。 P(B|A)是已知 A 发生后 B 的条件几率,也因为得自 A 的取值而被称做 B 的后验几率。 P(B)是 B 的先验几率,也做标淮化常量(normalizing constant)。
按这些术语,贝叶斯定理可表述为:blog
后验几率 = (类似度 * 先验几率)/标淮化常量
也就是说,后验几率与先验几率和类似度的乘积成正比。事件
另外,比例P(B|A)/P(B)也有时被称做标淮类似度(standardised likelihood),Bayes定理可表述为:ip
后验几率 = 标淮类似度 * 先验几率
假设有两个各装了100个球的箱子,甲箱子中有70个红球,30个绿球,乙箱子中有30个红球,70个绿球。假设随机选择其中一个箱子,从中拿出一个球记下球色再放回原箱子,如此重复12次,记录获得8次红球,4次绿球。问题来了,你认为被选择的箱子是甲箱子的几率有多大?get
调查结果显示,大部分人都低估了选择的是甲箱子的几率。根据贝叶斯定理,正确答案是96.7%。下面容我来详细分析解答。sed
刚开始选择甲乙两箱子的先验几率都是50%,由于是随机二选一(这是贝叶斯定理二选一的特殊形式)。即有:im
P(甲) = 0.5, P(乙) = 1 - P(甲);img
这时在拿出一个球是红球的状况下,咱们就应该根据这个信息来更新选择的是甲箱子的先验几率:
P(甲|红球1) = P(红球|甲) × P(甲) / (P(红球|甲) × P(甲) + (P(红球|乙) × P(乙)))
P(红球|甲):甲箱子中拿到红球的几率
P(红球|乙):乙箱子中拿到红球的几率
所以在出现一个红球的状况下,选择的是甲箱子的先验几率就可被修正为:
P(甲|红球1) = 0.7 × 0.5 / (0.7 × 0.5 + 0.3 × 0.5) = 0.7
即在出现一个红球以后,甲乙箱子被选中的先验几率就被修正为:
P(甲) = 0.7, P(乙) = 1 - P(甲) = 0.3;
如此重复,直到经历8次红球修正(几率增长),4此绿球修正(几率减小)以后,选择的是甲箱子的几率为:96.7%。