前几天给领导分析Dow的实验结果为何有蹊跷(之后有单独的一篇博文分析),因为对方呈现了不同的p值,包括0.01,0.05,甚至大于0.1的p值。 我就阐述了我对置信区间、置信度和p值的理解,卡住了三次,才把事情讲明白,说明我理解得还不够,“看完”和“会用”真的还有距离。整理这篇读书笔记,好好梳理一下观点。
《统计学的世界》第四部分 统计推断
本部分介绍的就是如何使用统计语言描述问题,分析问题和给出答案。
第21章 什么是置信区间
减少抽样调查,如何使用抽样结果来反映整体统计值(真值)
第22章 什么是显著性检验
介绍显著性检验,核心是零假设,p值
第23章 统计推断的滥用
介绍常见的错误使用情况,有点类似于最近在读的《统计数字会撒谎》
第24章 双向表与卡方检验
Q:已知(多次重复抽样)抽样的平均值和标准差,如何分析整体的平均值(真值)
A:当抽样量足够多时,利用正态分布,首先计算标准差;然后计算不同置信度下的置信区间,该置信区间就是真值所在的范围(在该置信度下)。
Q:如何使用置信区间判断整体的真值的大小?
A:首先抽取样本,利用样本结果计算抽样分布的标准差,使用样本统计量代替未知的统计量,从而得到基于抽样的标准差,进而获得不同置信度的置信区间,使用置信区间和置信度来描述整体在这个区间的概率。
Q:关键问题:如何计算样本标准差?
A:比如要判断一个硬币是否是正常硬币(正面朝上的概率是0.5),连续上抛50次,其中有36次是正面朝上,询问这个抽样分析的样本标准差是多少?
样本标准差公式:
《看穿一切的统计学》中的标准误差公式:
第二章介绍如何收集数据,即“抽样调查”方法,通过“标准误差公式”强调了达到一定抽样数量后的标准误差足以媲美完全调查;
第21章 什么是置信区间
关键词: 置信区间,整体和样本,抽样分布(多次重复抽样的平均值和分布),如何使用抽样结果推测整体的真值
关键内容: 用样本推测整体的情况,随机抽样,多次重复得到样本的平均值和标准差,基于此推测整体平均值,推测方法是置信区间,置信区间和置信度的对应关系,不同的置信度对应的置信区间就是整体真值在多大程度上位于该置信区间。
中心极限定律:要想使用正态分布曲线的性质(置信度,标准差关系)来推测整体平均值,对随机抽样的抽样量大小有要求,只有抽样量足够大,才能使用中心极限定律。【所以工作中的柔顺测试是32组毛巾,】
抽样分布: 如何从抽样样本的结果来反映整体的情况。
随机性:随机是统计分析和抽样调查的前提。
抽样调查和抽样分布:通过抽样调查,用局部反映整体的情况,抽样的计算出样本的平均值和标准差。
随机性和抽样分布是显著性检验的基础
使用抽样分布的平均值和标准差(方差开根号)去推测整体的平均值(整体的平均值是一个真值,没有波动和标准差,但是这个真值是未知的,所以要用抽样统计量推测),推测的依据就是正态分布曲线。 抽样分布的标准差就是多次重复抽样

以上的每个直线代表一次抽样调查,多次随机抽样,计算抽样的统计结果(平均值,标准差),然后推测整体的真值。
如何使用样本统计量p^ 推测未知的真实统计量p(真值)。
抽样调查:根据真值p和抽样量n,可以计算出标准差,方法是下面抽样分布的标准差公式。
抽样量是n,一次抽中的概率是p(比如抛硬币证明朝上的概率是0.5), 如何根据抽样n次(比如向上抛硬币共100次)时的成功计数(成功概率)推测整体的成功计数范围(上抛100次,正面朝上的比例是在哪个区间?)

备注:如果样本量n=1,只抽样一次(n=1)的话,就是数学上的“两点分布”模型(概率分布模型,成功为1的概率是p,失败为0的概率是1-p),方差是p(1-p),这个是根据标准差的计算公式积分推导而来。抽样次数越多,方差越小,当抽样数是n时,标准差如上图所示。【分许错误】
比如本章后面的习题:
布冯伯爵抛硬币。18世纪的法国自然主义者布冯伯爵曾抛了4040次硬币,正面朝上的次数是2048。为布冯伯爵的硬币正面朝上的概率算出其95%置信区间。你是否能证明这个概率不是1/2?为什么?
[计算方法:n=4040,p=0.5,使用上面的抽样分析的标准差公式计算标准差(只是一次抽样的标准差),该标准差就是0.0079,所以95%置信度时正面朝上的概率范围是0.5-0.0079 * 2~0.5+0.0079 * 2,即0.48~0.51,而实际的正面朝上的比例是2048/4040=0.507,在上面的范围内,所以95%概率下,该硬币是正常硬币。
Q问题: 上面的“抽样分布的标准差公式”和《看穿一切的统计学》 读书笔记 – Zero 中的“抽样的标准误差公式”的关系是什么?
A: 标准差和标准误差的关系。前者是标准差,是一次抽样的偏差程度【计算一次抽样的范围】;后者是标准误差,是多次重复抽样的抽样统计量能反映整体的可能性【由样本推导整体】。 相当于前面第一个图片的一个横线和多个横线的关系。
抽样调查的标准误差计算公式如下,该公式是计算抽样次数和抽样的标准误差的关系,抽样人数越多,标准误差越小,样本能更准确推测整体。
比如说抽样调查的结果显示失业率为25%,假设其标准误差为0.5%,那么全面调查得到的真实失业率数值应该在24%~26%之间,这一数据的可信度高达95%。 《看穿一切的统计学》
正态分布和中心极限定律
中心极限定律:;当抽样量足够大时,连续多次抽样,抽样结果接近正态分布。然后就可以利用正态分布曲线的置信度和置信区间的关系,列出不同的可能性和真值所处的范围!
使用正态分布的置信度和置信区间的关系,定量分析不同置信度下的结论。

比如对于95%置信度,真值对应的置信区间是样本的平均值±两个标准差的。
抽样平均值,标准差,置信区间(平均值左右两侧各几个标准差)的关系:
95%:当总体参数的值为p时,有95%的样本统计量p^ 的值落在p值往左右各延伸两个标准差的区间内。
68%: 平均值左右各延伸1个标准差
99%:平均值左右各延伸2.58个标准差
99.9%:平均值左右各延伸3.29个标准差

备注:常用的置信度是68,95和99.7,分别对应临界值为1,2,3个标准差。

本章要点
统计推断指的是根据样本数据对总体得出结论。因为我们没有总体的数据,所以统计推断的结论并非完全正确。
• 当估计一个未知参数时,置信区间可以为我们提供该估计的不确定程度。区间能够告诉我们,对未知参数可以“定位”到什么程度。置信度是一个概率,它告诉我们在许多样本当中,我们的方法所产生的区间确实会包含参数的机会有多大。要找到置信区间,先得考虑统计量的抽样分布,也就是多次抽样统计量会如何变化。
• 我们讨论了一种特定的置信区间,也就是根据从总体抽出的简单随机样本中的成功比例,估计出总体中的成功比例p的置信区间。p的置信区间建立在的抽样分布之上,当样本量n很大时,这个分布近似于正态分布。
• 我们用总体的一个简单随机样本的平均数估算总体平均数μ。μ的置信区间建立在的抽样分布之上,当样本量n很大时,中心极限定理指出这个分布近似于正态分布。
我们收集数据的目的不是了解我们所观察的个体,而是得出关于总体的结论。
本章后面的一个典型习题:布冯伯爵抛硬币。18世纪的法国自然主义者布冯伯爵曾抛了4040次硬币,正面朝上的次数是2048。为布冯伯爵的硬币正面朝上的概率算出其95%置信区间。你是否能证明这个概率不是1/2?为什么? 【经典案例,之后也可以用贝叶斯推理来分析】
2019.03.17