学多点知识算法
你好我也好机器学习
广州又在下大暴雨了,超模君仍是一如既往待在工做室码着字!学习
(看图猜地方,猜对了,送你一个糖)blog
即使天气很差,也不能冷落个人模友们,那今天先来说讲贝叶斯定理。事件
估计开始了,那就拿好小板凳。图片
众所周知,贝叶斯定理是一种在已知其余几率的状况下求几率的方法:数学
图片来源:HackYourself基础
既然开讲了,那就不要停下来了。方法
那咱们怎么去理解这个传说中不黄但很暴力的贝叶斯定理呢,贝叶斯定理是如何暴力狂虐数学界的?im
首先,对于贝叶斯定理,仍是要先了解各个几率所对应的事件。
P(A|B) 是在 B 发生的状况下 A 发生的几率;
P(A) 是 A 发生的几率;
P(B|A) 是在 A 发生的状况下 B 发生的几率;
P(B) 是 B 发生的几率。
还没看懂。。。那我仍是举个栗子吧
京西大旅馆为了庆祝开业三周年的好日子,老板刘强西准备带着实习生小天去郊外旅游,不过一大早天空多云:
糟了!50%的雨天的早上是多云的!
但多云的早上其实挺多的(大约40%的日子早上是多云的)!
这个月干旱为主(平均30天里通常只有3天会下雨,10%)!
刘强西45°角仰望天空,想着要不要去郊游。。。
做为聪明的实习生,小天立马拿出他的小本子:
此时,咱们用"雨"来表明今天下雨,"云"来表明早上多云。
当早上多云时,当天会下雨的可能性是 P(雨|云)。
P(雨|云) = P(雨)·P(云|雨)/P(云)
P(雨) 是今天下雨的几率 = 10%
P(云|雨) 是在下雨天早上有云的几率 = 50%
P(云) 早上多云的几率 = 40%
基本的几率状况已经肯定,那就简单了
P(雨|云)=0.1×0.5/0.4=0.125
小天:刘老板,不用看天气了,今天下午的几率只有12.5%,能够去郊游的。
刘强西听完后:行,那赶忙上车!
然而,“小天”算不如天算,你看,天就下雨了。。。
小天尴尬ing
故事到这里还没结束,超模君当时在学习贝叶斯定理的时候,时常会记不住究竟是B在前,仍是A在前,公式该怎么写。
直到有一次,小天(这个小天是超模君的小天,不是刘强西的小天)看我在写贝叶斯公式,说出:AB AB AB。
因此对于贝叶斯公式,记住AB AB AB,而后再作分组:"AB = A×BA/B"。
别急,假如“A”还有两个可能
各位模友,大家据说“假阳性”、“假阴性”这两个词吗?
是的,没错,就是某些疾病检测通常喜欢用名词,医学院的同窗赶忙拿好小板凳,接下来就是考试重点了。
贝叶斯定理虽然只是一个几率计算公式,但其最著名的一个用途即是“假阳性”和“假阴性”检测。
再丢个栗子。。。
上次没出成郊游,刘强西却在路边捡了一只小流浪猫回京西大旅馆,天天就顾着撸猫。。。
两天事后,刘强西忽然浑身发痒,小天就想起来是否是刘强西对猫过敏,因而刘强西就作了一个简单的过敏检测:
对于真的有这种过敏的人,检测有80%的机会给回 "有" 的结果;
对于没有10%的机会给回 "有" 的结果(而这种状况,称之为"假阳性")。
从实际状况看,京西大旅馆的村子有 1% 的人有这种过敏,而刘强西的检测结果是 "有",那么刘强西真的有这种过敏的可能性有多大?
P(过敏) 是有这种过敏的几率 = 1%
P(有|过敏) 是对于真的有这种过敏的人,检测的结果是 "有" = 80%
P(有) 是对于任何人,检测的结果是"有" = ??%
糟糕!咱们并不知道检测结果是 "有" 的通常可能性是多少……
不过咱们能够把有这种过敏和没有这种过敏的几率相加来求这个通常几率:
1% 的人有这种过敏,检测对 80% 的这些人说 "有"
99% 的人没有这种过敏,检测对 10% 的这些人说 "有"
把几率加起来:
P(有) = 1% × 80% + 99% × 10% = 10.7%
就是说大约 10.7% 的人会获得 "有" 的检测结果。
那此时咱们就能够计算出,刘强西真正对猫过敏的几率为
P(过敏|有) = 1% × 80%/10.7%= 7.48%
因此此时也就有了贝叶斯定理特别版:
最后说多两句:
贝叶斯统计做为经常使用的基础算法,不要小看其做用,其在机器学习中是占据重要的一席之地。尤为是在数据处理方面,针对事件发生的几率以及事件可信度分析上具备良好的分类效果。