本文出处主要来源于 https://blog.csdn.net/Hearthougan/article/details/75174210,感谢该博主的博客。spa
贝叶斯分类器的前提条件是全几率公式以及条件几率公式:、.net
1:条件几率公式3d
举个例子,好比让你背对着一我的,让你猜猜背后这我的是女孩的几率是多少?直接猜想,确定是只有50%的几率,假如如今告诉你背后这我的是个长头发,那么女的几率就变为90%。因此条件几率的意义就是,当给定条件发生变化后,会致使事件发生的可能性发生变化。blog
也能够利用维恩图进行理解事件
表示B发生后A发生的几率,由上图能够看出B发生后,A再发生的几率就是
,所以:博客
由:io
得:class
这就是条件几率公式。基础
假如事件A与B相互独立,那么:im
注:
相互独立:表示两个事件发生互不影响。而互斥:表示两个事件不能同时发生,(两个事件确定没有交集)。互斥事件必定不独立(由于一件事的发生致使了另外一件事不能发生);独立事件必定不互斥,(若是独立事件互斥, 那么根据互斥事件必定不独立,那么就矛盾了),可是在几率形式上具备一些巧合性,通常地:
可是,对于两个独立事件,依然能够等于0,由于事件A或者事件B发生的几率可能为0.因此
,并非必定表示互斥。互斥和独立的理解仍是要究其真正意义,而不是表达形式。
先举个例子,小张从家到公司上班总共有三条路能够直达(以下图),可是每条路天天拥堵的可能性不太同样,因为路的远近不一样,选择每条路的几率以下:
天天上述三条路不拥堵的几率分别为:
假设遇到拥堵会迟到,那么小张从Home到Company不迟到的几率是多少?
其实不迟到就是对应着不拥堵,设事件C为到公司不迟到,事件为选择第i条路,则:
全几率就是表示达到某个目的,有多种方式(或者形成某种结果,有多种缘由),问达到目的的几率是多少(形成这种结果的几率是多少)?
全几率公式:
设事件是一个完备事件组,则对于任意一个事件C,如有以下公式成立:
那么就称这个公式为全几率公式。
3、贝叶斯公式
仍旧借用上述的例子,可是问题发生了改变,问题修改成:到达公司未迟到选择第1条路的几率是多少?
可不是,由于0.5这个几率表示的是,选择第一条路的时候并无靠考虑是否是迟到,只是由于距离公司近才知道选择它的几率,而如今咱们是知道未迟到这个结果,是在这个基础上问你选择第一条路的几率,因此并非直接就能够得出的。
故有:
因此选择第一条路的几率为0.28.
贝叶斯公式就是当已知结果,问致使这个结果的第i缘由的可能性是多少?执果索因!
贝叶斯公式:
在已知条件几率和全几率的基础上,贝叶斯公式是很容易计算的: