贝叶斯算法实例讲解(数据分析入门贝叶斯定理)
贝叶斯算法实例讲解(数据分析入门贝叶斯定理)
2024-11-22 11:45:26  作者:泪水生活  网址:https://m.xinb2b.cn/know/wdn117283.html

贝叶斯定理是什么,有什么用处?可能很多人都听过这个贝叶斯定理,却对它一知半解。事实上,不懂贝叶斯定理不会让我们的生活崩塌,不会让我们的生活一团乱麻,但是一旦掌握了贝叶斯定理,在很多决策场景中,我们将会变得更加明智。

今天我们将通过一个实际生活中的案例,用最通俗的方式帮助大家理解它。后续的话,我会为大家讲解如何用Python在实际案例中应用贝叶斯定理,感兴趣的朋友欢迎关注哦

小明到底有没有得癌症?

这是一个非常经典的案例,令人难以想象的是,很多时候一些医生的误诊竟是因为他们不懂贝叶斯定理!

考虑这样的场景,医生常通过某种血检来辅助判断病人是否罹患某种癌症。但是这种血检返回的结果并不是百分百的精准,当患者的确患病时,血检返回阳性的概率为98%;当患者没有患病时,血检返回阴性的概率为97%。已知有千分之一的人会得这种癌症。

现在小明做了这种血检,并且检测结果显示阳性,那么请问他得病的可能性大,还是没病的可能性大呢?

用直觉来判断,是不是第一反应就是小明大概率得了这种癌症了?

然而事实并非如此,小明得病的概率仅有3.17%!是不是非常难以置信?检验为阳性的时候,小明患病的概率竟然只有3.17%!现在应该很多同学不认可这个结果,那么接下来我们就看一下贝叶斯定理是个什么东西。

条件概率

认识贝叶斯定理之前,我们有必要先了解下条件概率以及它的一些性质。

条件概率是指在某些背景约束(或前提条件)下某事件发生的概率,比如令一名学生考上清华大学作为事件A,其概率为P(A),学生是女生作为事件B,其概率为P(B),那么在学生是女生的前提条件下,学生考上清华的概率就是P(A|B)。下面我们分别考虑事件A与事件B之间是否相互独立的情况。

事件A与事件B相互独立:如果事件A和时间B是相互独立的,那么P(A)=P(A|B),无论B是否发生,对于事件A的发生没有影响,这时也有P(AB)=P(A)P(B),即事件A、B同时发生的概率是两个事件各自发生概率的乘积。事件A与事件B之间不相互独立:事件A、B同时发生的概率为P(AB),那么P(AB)=P(A|B)P(B)=P(B|A)P(A),也就是说两事件同时发生的概率为其中一个事件发生的概率乘以在该事件发生的前提下另一事件发生的概率。无论事件A、B之间是否相互独立,这个等式都成立,它就是贝叶斯定理的基础。


贝叶斯定理

从式(1)可以得知:


式(2)就是鼎鼎大名的贝叶斯定理了,我们来从另一个角度理解一下它的意义。我们用数据集D替换事件B,用假设H替换事件A,得到:


这就给我们提供了一种方法,可以根据数据集D的变化不断更新假设H发生的概率,这种方式被称作“历史诠释”。

P(H)可以理解为假设H发生的先验概率;P(H|D)则可以理解为假设H发生的后验概率,是在我们获得了更多数据的情况下推断出的更先进的概率;我们每次获得的新知识,也就是后验的数据,都会作为下一次计算的先验数据;P(D|H)可以被理解为似然度,也就是在假设H发生的情况下,数据分布刚好是D的概率;P(D)则是在任何假设下数据分布刚好为D的概率,我们把它称为标准化常量。

那么我们现在来回头看小明是否得癌症的问题。


等式的前半部分就是贝叶斯定理的公式。而在后边计算P(阳性)的时候,可以看到我们用了两部分相加得到了P(阳性)。这里我们不得不介绍一下全概率公式:


拿我们这个例子来说,P(B)就是P(阳性),然而P(阳性)的数据我们无法直接获取,但是我们知道在患病和无病的条件下血检为阳性的概率,也知道患病和无病的概率,因此把患病情况下血检为阳性的条件概率乘以患病的概率,再加上无病情况下血检为阳性的条件概率乘以无病的概率,就是所有情况下血检为阳性事件发生的概率了,即:


那么最后我们给出完整的计算过程:


你学会了吗?有任何问题都可以在下方留言,我会一一回答!

  • 蝴蝶与诗人(蝴蝶与梦中)
  • 2024-11-22蝴蝶与梦中前一阵子加班特别晚,回到宿舍准备睡觉的时候,手机突然亮了一下,看一眼是个蛮久不联系的朋友发的消息,强忍着睡意了回复了她消息,她很快就回复了,前几句无非是你好我好的过场,我猜她大概有什么事要说,但却无心。
  • 花露水八角泡水(花露水泡八角太厉害了)
  • 2024-11-22花露水泡八角太厉害了嗨,大家好,我是七彩,每天给大家分享一个小妙招,今天给大家分享用花露水来泡八角,它的作用厉害了,很多朋友都不知道,八角和花露水对于我们来说并不陌生,八角是我们常用的香料,可以用来炒菜,炖肉等,而花露水。
  • 杨洋出道以来的电视剧(杨洋竟然有部电视剧豆瓣评分高达7.4分)
  • 2024-11-22杨洋竟然有部电视剧豆瓣评分高达7.4分最近剧荒,翻了翻以前的电视剧,竟然发现有部杨洋主演的电视剧豆瓣评分高达7.4??当时我就震惊了,立马点开看了起来,没想到一看就停不下来!真香啊~图片来自网络所以今天我就要说一说这部《全职高手》近年来,。
  • 财神爷忌讳放在什么地方(财神爷忌讳放在哪些地方)
  • 2024-11-22财神爷忌讳放在哪些地方不宜摆放在厕所处财神爷是具有招财进宝的意义,将其摆放在家里可很好的促进运势的发展,但也有一些的禁忌不能犯,一般家里的厕所是家里污秽之气最多的地方,所以不能将财神放在此处,否则会造成阴盛阳衰,导致财神的。
  • 爱情公寓陈美嘉呆萌(爱情公寓陈美嘉)
  • 2024-11-22爱情公寓陈美嘉情景喜剧《爱情公寓》系列的四大女主角之一,由李金铭饰演,是一个古灵精怪,活泼可爱的宅女,数学超差,算数过程是一七得七,二七四十八,三八妇女节,五一劳动节,六一儿童节......,活泼好动、非常能吃。
  • 帕丁顿熊儿童(帕丁顿熊教会我们的那些事儿)
  • 2024-11-22帕丁顿熊教会我们的那些事儿周末,我和儿子去电影院看了《帕丁顿熊2》,我们裹上厚重的大衣,把脸深深埋进围巾里,还是冷不防被冻得打了几个哆嗦幸好有这样一部暖心的电影,它像一杯热巧克力一样,让人从心窝暖到脚趾剧情讲述的是,3年前那只。
  • 日本温泉诡异事件(日本泡澡死亡率高于交通事故多数为老人)
  • 2024-11-22日本泡澡死亡率高于交通事故多数为老人【日本】政府呼吁“泡澡需谨慎”死亡率比交通事故还高据日本广播公司报道,由于1126的日语谐音为“好好泡澡”(良い風呂),因此11月26日被定为“泡澡日”不过,日本消费者厅提醒民众泡澡时要多注意安全,并。
  • 最新所得税汇算清缴填报说明 2022年度汇算清缴填报要点
  • 2024-11-22最新所得税汇算清缴填报说明 2022年度汇算清缴填报要点企业所得税到了年初需要汇算清缴,有的时候报表的内容会修改,我们就需要知道修改的内容应该怎么填写,哪里修改了,在填写的时候需要做什么调整,针对调整的填报内容,已经做了一份整理,快来看看吧~企业所得税汇算。
  • 冰箱保鲜几度最好(保鲜适合的温度)
  • 2024-11-22保鲜适合的温度肉类:冷冻温度为-1至1度,冷藏温度为0-2度,腌肉冷藏为2-7度;鱼类:冷冻温度为-18至-15度,短期冷藏为5-7度,干鱼冷藏为2-5度;家禽:冷冻温度为-10至-6度,短期存放为-4至-1度,自。
  • 海信冰箱怎么解锁调温度(具体解锁方法教程)
  • 2024-11-22具体解锁方法教程按键锁定和解锁:在按键解锁状态,若10s无任何按键操作,自动进入锁定状态,“锁定图标”亮,除“解锁键”外其他按键不起作用在按键锁定状态按下“解锁键”,按键解锁,“锁定图标”灭,可以进行其他按键功能操作。
  • 实用节水小妙招(节水知识小科普)
  • 2024-11-22节水知识小科普水对我们的生命起着重要的作用,它是生命的源泉,是人类赖以生存和发展的不可缺少的最重要的物质资源之一进入20世纪90年代后,地球变暖,气温升高,气候干燥,雨量稀少等自然气候成为常态,加之人们对水的需求量。