贝叶斯公式是一个很是经常使用的几率论里的关于条件几率的公式,是数据科学面试中的常见题型。掌握贝叶斯公式的原理而且使用该公式解决这些问题是数据科学家求职者的必备技能。面试
条件几率Pr[A|B]必须定义在两个事件A和B上,含义是在B发生的条件下,A发生的几率。blog
能够想象B是已经知足的条件,条件几率便是在给定条件下A事件的几率。除非A与B独立,不然B的发生会影响A,所以必定有 与 不想等。事件
数学上,数学
为A与B同时发生的几率与B发生的几率的比例。it
几何上,能够用文恩图表示事件A与B:io
B已经知足条件能够看做全集是B,即黑色圈出的区域,在该区域中发生A,对应A与B的交集区域。所以几率为A与B交际区域的面积与B的面积的比例。class
全几率公式很是直观,其含义是若是有一些互斥的事件 , 它们的并集为全集。则任何事件A发生的几率能够拆分为每个 的几率之和。求职
数学上,原理
由条件几率的定义,等价于互联网
A被 这些事件划分红了 ,所以A的面积为这些面积之和。
贝叶斯公式对于两个事件A和B定义,只要事件B的几率非0,有以下关系:
推导很是容易:
贝叶斯公式通常结合全几率公式使用,咱们以一个简单的例子说明:
Q: 某城市发生了一块儿汽车撞人逃跑事件,该城市只有两种颜色的车,蓝20%绿80%,事发时现场有一个目睹者,他指证是蓝车,可是根据专家在现场分析,当时那种条件能看正确的可能性是80%,那么,肇事的车是蓝车的几率是多少?
A: 目睹者指证蓝车记为事件B, 肇事的车是蓝车记为事件A, 须要计算条件几率 。
由贝叶斯公式,只须要计算 ,以及 。
根据题目条件, 。
比较困难的是计算 自己。为了计算 ,咱们使用全几率公式:
其中 为A的补事件,即肇事的车是绿车。
前面两项已经知道, ,关键是最后一项 ,即肇事的车是绿车的条件下,目睹者指正该车为蓝车的几率。
这一律率就是目睹者看错的几率0.2。
所以,咱们有
根据贝叶斯公式
咱们对贝叶斯公式的介绍到这里就告一段落,你们能够尝试如下这些练习题,都是知名互联网的面试真题哦。