几率论面试系列第一弹: 贝叶斯公式

贝叶斯公式是一个很是经常使用的几率论里的关于条件几率的公式,是数据科学面试中的常见题型。掌握贝叶斯公式的原理而且使用该公式解决这些问题是数据科学家求职者的必备技能。面试

 

条件几率(conditional probability)的定义

条件几率Pr[A|B]必须定义在两个事件A和B上,含义是在B发生的条件下,A发生的几率。blog

能够想象B是已经知足的条件,条件几率便是在给定条件下A事件的几率。除非A与B独立,不然B的发生会影响A,所以必定有 \Pr[A|B] 与 \Pr[A] 不想等。事件

数学上,数学

\Pr[A|B] = \frac{\Pr[A\cap B]}{\Pr[B]}

为A与B同时发生的几率与B发生的几率的比例。it

 

条件几率的几何意义

几何上,能够用文恩图表示事件A与B:io

B已经知足条件能够看做全集是B,即黑色圈出的区域,在该区域中发生A,对应A与B的交集区域。所以几率为A与B交际区域的面积与B的面积的比例。class

 

全几率公式

全几率公式很是直观,其含义是若是有一些互斥的事件 B_1, \ldots, B_k , 它们的并集为全集。则任何事件A发生的几率能够拆分为每个 A \cap B_i 的几率之和。求职

数学上,原理

\Pr[A] = \Pr[A \cap B_1] + \Pr[A \cap B_2] + \ldots + \Pr[A \cap B_k]

由条件几率的定义,等价于互联网

\Pr[A] = \Pr[B_1]\Pr[A|B_1] + \Pr[B_2]\Pr[A|B_2] + ... + \Pr[B_k]\Pr[A|B_k]

 

全几率公式的几何意义

A被 B_1, B_2, ..., B_k 这些事件划分红了 A\cap B_1, A\cap B_2, ..., A\cap B_k ,所以A的面积为这些面积之和。

 

贝叶斯公式

贝叶斯公式对于两个事件A和B定义,只要事件B的几率非0,有以下关系:

\Pr[A|B] = \frac{\Pr[B|A]\Pr[A]}{\Pr[B]}

推导很是容易:

\Pr[A|B]\Pr[B] = \Pr[A\cap B] = \Pr[B|A]\Pr[A]

 

例子

贝叶斯公式通常结合全几率公式使用,咱们以一个简单的例子说明:

Q: 某城市发生了一块儿汽车撞人逃跑事件,该城市只有两种颜色的车,蓝20%绿80%,事发时现场有一个目睹者,他指证是蓝车,可是根据专家在现场分析,当时那种条件能看正确的可能性是80%,那么,肇事的车是蓝车的几率是多少?

A: 目睹者指证蓝车记为事件B, 肇事的车是蓝车记为事件A, 须要计算条件几率 \Pr[A|B] 。

由贝叶斯公式,只须要计算 \Pr[A], \Pr[B] ,以及 \Pr[B|A] 。

根据题目条件, \Pr[A] = 0.2, \Pr[B|A] = 0.8 。

比较困难的是计算 \Pr[B] 自己。为了计算 \Pr[B] ,咱们使用全几率公式:

\Pr[B] = \Pr[A]\Pr[B|A] + \Pr[A^c]\Pr[B|A^c]

其中 A^c 为A的补事件,即肇事的车是绿车。

前面两项已经知道, \Pr[A^c] = 1 - \Pr[A] = 0.8 ,关键是最后一项 \Pr[B|A^c] ,即肇事的车是绿车的条件下,目睹者指正该车为蓝车的几率。

这一律率就是目睹者看错的几率0.2。

所以,咱们有

\Pr[B] = 0.2 * 0.8 + 0.8 * 0.2

根据贝叶斯公式

\Pr[A|B] = (0.2 * 0.8) / \Pr[B] = 0.5

 

练习题

咱们对贝叶斯公式的介绍到这里就告一段落,你们能够尝试如下这些练习题,都是知名互联网的面试真题哦。

  1. 有8个箱子,如今有一封信,这封信放在这8个箱子中每个的几率均为1/10, 不放在任何一个箱子的几率为1/5, 如今我打开1号箱子发现是空的,求下面7个箱子中含有这封信的几率?
  2. 一个盒子里面有2张扑克牌有正反两面,有1张扑克牌只有正面。随机地取出了一张牌看到了正面,求该扑克牌的对面也是正面的几率。
  3. 你有三位好友,他们都在西雅图工做,西雅图是出了名的爱下雨,天天下雨的几率高达2/3。假设你的好友视力都不是很好而且办公室的视野也通常,所以以1/3的几率能正确地判断是否在下雨。假如他们中刚好有两位告诉你今天西雅图在下雨,问西雅图实际上在下雨的几率是多少?