这是一本超好的贝叶斯推理入门图书,读完之后再研究英文版的ten great ideas about chance 的贝叶斯部分(inverse )。
一边阅读一边用ipad的split功能整理要点,这本书第一部分几乎都是在飞机上或飞机场看完的,这儿整理第一部分读书笔记,分成两部分发布,2019年9月开始用下班地铁时间读这本书的剩余部分,读了快一年,今年下半年该finish这本书了。
本书第一部分的标题是“理解贝叶斯统计学的精髓“,其中第1-4讲是通过介绍几个贝叶斯推导的案例,让我们理解什么是贝叶斯推理;第5-13讲则是强调了贝叶斯推理和标准传统统计推理即内曼-皮尔逊统计学的不同,这也是我之前的一个”概率阅读主题总结“想要强调的观点。
统计主题阅读3:两种推理方法之一——统计推断
统计主题阅读4:两种推理方法之二——贝叶斯推理-1
这本书最重要的知识点就是如何俄使用面积法快速进行贝叶斯推导! 这个比贝叶斯公式好用又好理解!
《超越智商》一书中提及一个缺失的思维模式,即忽略基础概率,对应的就是贝叶斯推理!!
《统计学的世界》将概率分为两类,一是“个人概率”或“主观概率”,二是“长期概率”。我们常说的统计概率主要指的是长期概率,这也是贝叶斯推理的主要应用点。
贝叶斯推理既适用于长期概率,又适用于主观概率或个人概率。前两讲是长期概率的例子,第一个是售货员判断顾客购物意图,第二个是医院假阳性事件;第三讲的“真命天子”和“生男孩女孩”案例,则是主观概率或个人概率。
第一讲 贝叶斯推理:信息增加导致概率变化
关键词:贝叶斯更新,先验/基础/条件概率,后验概率
本讲例子:售货员对每个进店的顾客有一个初始的概购买东西概率,然后售货员根据顾客是否上前询问这个行为,利用贝叶斯推理更新顾客的购买概率。
基础概率/条件概率:最开始的基本判断,假设80%的顾客只是逛逛。
新的信息:一位顾客向前询问价格等事宜,改变了售货员对该顾客是否购买商品的概率判断,更新后的概率就是后验概率,比如从最开始的20%上升为3/7,其中3/7是排除掉不上前询问的人群,然后进行概率归一化(保证总概率为1)的结果,具体如下图表所示。
贝叶斯推理可以总结为:通过观察行动(信息),将先验概率通过贝叶斯更新,转换为后验概率。
先验概率,是“在获得信息之前,各个类别的存在概率”。



看这个图表便可了解到,在没有观察到任何行为时,面前的顾客是“来买东西的人”的概率为0.2(先验概率),但观察到“上前询问”这一行为之后,数值便更新为约0.43(后验概率)。也就是说,虽然并不能断定这位顾客就是“来买东西的人”,但这一结果的可能性提高到了以前的两倍,这便是“贝叶斯更新” 。
第二讲 贝叶斯推理结果和直觉的冲突
关键词:假阳性案例,
本讲例子:患癌症的概率和假阳性概率(贝叶斯经典案例)。
假阳性问题,提醒我们“如果从客观的数据来考虑的话,反而会容易陷入误解之中”,因为只看仪器的测试结果,没有从整体考虑患者在人群中的比例,仪器准确性。
假设,某种特定的癌症的患病率为0.1%(0.001)。有一个简易的方法能够检查出是否患上这种癌症:患上这种癌症的人中有95%(0.95)的概率被诊断为阳性。但另一方面,健康人群也有2%(0.02)的可能性被误诊为阳性。那么,如果在这个检查中被诊断为阳性的时候,实际患上这种癌症的概率为多少呢?
先验&基础概率:社会的患病率是0.1%。
新条件:仪器检测到阳性结果。
后验概率:那么真正患病概率(真阳性)是多少?
答案是,真正罹患癌症的概率从检查前的0.1%升高到4.5%,没有得病(假阳性)的概率依然高达95.5%。
所以不能依靠一次仪器检查,就100%认为真的生病了。
贝叶斯推理的面积法分析:
【根据上一章内容自行补充】
“ 如果在准确度为 95% 的癌症检查中,你的检查结果呈阳性,那么,你患癌症的概率是否为 95% ?”答案是否定的。
至于为何概率会如此之低,原因在于,患癌症的可能性本来就极其微小,健康人群中所占的比例远高于患癌症的人,健康人被误诊为阳性的可能性也很大,这一部分数值不能忽视。因此,即便检查结果呈阳性,也有很极大的可能性是健康人被误诊。所以,千万不要过度悲观。
这里的关键就是不要忽略基础概率!
Q2:为何有这么高的假阳性概率,多精确的检测仪器才能降低假阳性到可以接受的程度,比如5%?
答案:从误差的角度看这个问题,工具精确度不够高,也就是“控制能力不足”。
关键问题是基础概率很低(患者占总人群比例太低),其次是检测工具精确度不够(很低的基础概率就需要足够高的精确度做补偿,比如99.99%仪器精确度产生多大的假阳性】
现实中,会同时使用多个观察和测试来限制假阳性的概率,比如去多个机构用同一个方法复检,比如多种检测方法互相核实。
第三讲 主观概率的贝叶斯推理
基于主观判断给出一个先验概率,或者不能确定概率,就将所有可能视为机会相等。
本章举例,根据美女是否给自己鲜花,判断美女是否对自己有进一步发展的概率。
先验概率是主观概率,没有固定设定,所以可以自己设定,比如50%或者40%。
基础概率:
类别 | 送出巧克力的概率 | 不送巧克力的概率 |
---|---|---|
真命天子 | 0.4 | 0.6 |
无关路人 | 0.2 | 0.8 |
新条件:女生给自己送巧克力
后验概率:
从结果来看,如果你收到了女同事的巧克力,那么,你成为她的“真命天子”的事后准确率便为2/3,约等于66%。
因此,“女性同事认为你是她的真命天子的概率”中的“概率”,应当解释为:你内心描绘的类似“信念程度”这样的概念。也就是说,并非“概率是多少”的问题,而应该理解为“你认为概率是多少”。
像这样,可以解释为“人的内心描绘的数值”的概率称为“主观概率”。主观概率在学校教育中并不涉及,因此,很多人会认为主观概率是不可信的。但在统计学和经济学中,“主观概率”始终占有一席之地。
第四讲 概率的概率
这一部分针对特定夫妻生男孩还是生女孩,进行一次“主观概率的贝叶斯推导”。
好像之前罗辑思维使用这个案例发过一篇文章,结果被喷“不懂概率”,实际这就是长期概率和主观概率的区别,这儿是分析一对夫妻的主观概率,而不是分析大量夫妻得出的长期概率。
这个部分有点难,基础概率是这一对夫妻生女孩的概率是0.4,0.5, 0.6(当然可以分得更细),然后设置三个概率的基础概率都是1/3。
然后根据“第一胎是女孩”,去掉三个情况下生男孩的可能性,然后重新归一化,计算三个条件的后验概率,基于此判断第二胎是女孩的概率(这里就用到了期望值,把三种情况汇总求和)。
问题:假设夫妻俩的第一个孩子是女儿。那么,第二胎依然是女儿的概率为多少?
标准统计学(又称内曼-皮尔逊统计学)在阐明全人类范围内的男女例这一性向问题时是有效的,但不能用来解答“特定的某一对夫妻更容易生男孩还是女孩”的问题。这是因为,如果不使用达到一定程度的大量数据,就不能运用标准统计学来推断,关于这一点,在第8讲中会进行详细的解说。理由是,对于某一对特定的夫妻,他们所生的孩子数量,并不足以用来进行统计验证;而且,在生下大量的孩子的过程中,随着年龄的增长,身体条件也会发生变化。
答案1:永远都是50%或某一个长期概率。(概率派)
答案2:先验概率是一个概率分布(不同概率下的概率),新条件是第一胎是女孩,那么第二胎依然是女孩的概率会提高到多少?(贝叶斯派)
之前都是两个选项(类型变量:患病or不患病,喜欢or不喜欢)的概率,这次是三个分类,默认三个分类,然后将三个分类的概率暂定为1/3
Revision history
2018.12.4 飞机,读完第一和第二讲
2018.2.24 飞机
2019-2-28 广州白云机场
2019-5-13 去广州飞机上,第五章
2019-7-26 火车上
2019-9-3 梳理读书笔记,更新第一讲的图表和说明。
2019-9-9 下班地铁