《design and analysis of experiments》《实验设计与分析》(第6版)
作者:Douglas C. Montgomery
第二章 简单比较实验 simple comparative experiment
关键词:两样本比较,假设检验,t检验,F检验;盒图,抽样盒总体,协方差;正态分布,t分布,F分布,卡方分布;配对比较
2.1 引言 和2.2 基本统计概念
关键词:假设检验hypothesis testing,显著性检验significance testing
两两对比实验,一个简单的例子,如下图所示,两种水泥配方,各取10个样品测试抗拉强度,绘制成点图(dot diagram),比较两种水泥(两个总体)的抗拉强度,是否有显著性差异?

从点图(如果数据量较多,可以用直方图进行分组)可以看出,观测值的总体位置(center)和分散程度(spread)。
使用盒图呈现数据的最大值、最小值、下四分位数、上四分位数,和中位数,如下图所示。【注意是中位数,不是平均值】

总之,以上的两组样品之间的数据,可以用点图、直方图、盒图描述,方便直观了解样本的统计信息(center + spread)。
概率分布(probability distribution):
均值mean、方差variance、和期望值expected value:
协方差的概念:表征两个变量之间的线性相关性,如果独立不相关,则协方差为零。

2.3 抽样和抽样分布
关键词:随机样本(random sample),统计量(比如样本均值mean,样本标准差variance,样本标准差),
统计推断:利用抽样样本观测值,分析总体的参数。
样本均值和样本标准差,是总体均值u和总体方差的无偏估计量,证明如下:

自由度degree of freedom
正态分布Normal distribution
中心极限定理:从总体中抽取n个样品,样本均值的分布,与抽样量n有关。【书上讲得有点糊涂,还要再看一下】
正态分布的三个导出分布:
- 卡方分布: 方差的分布,与抽样量有关,抽样较少时是偏斜分布,抽样量增加,越来越接近正态分布
- t分布:样本量较少的分布,比正态分布更胖,分布与抽样量相关,抽样量增加,接近正态分布。
- F分布: 两个样本的方差比值的分布
2.4 关于均值差的推断,随机化设计
2.4.1 假设检验
使用假设检验hypothesis testing和置信区间confidence interval,分析本章开头提到的两种水泥配方的抗拉性能。
基本知识点:零假设null hypothesis(两种水泥之间没有差异),备则假设alternative hypothesis(有差异), alpha风险,beta风险:
两样本的t检验:
手动计算方法一:根据两个样本的均值、标准差,计算统计检验量t=-2.2 < -2.1,落入拒绝域。
手动计算方法二:p方法,根据p=0.041<0.05,发生零假设的概率太低,所以拒绝零假设。
p值是当零假设H0为真时,检验统计量至少取得像统计量观测值一样极端的概率。形式上,p值是拒绝零假设H0的最小显著性水平。
计算机辅助计算:Minitab,直接给出两样本均值对比的p值和差值的95%置信区间(看0是否在这个区间里面即可)。
t检验中的假定检验:正态性假设和独立性假定

使用正态概率图(计算机辅助生成),判断数据是否符合正态性假设。如下图所示,数据点是是按照大小排序,纵坐标则是累积频率分布;主观判断所有的数据点是否可以拟合在一条直线上,不会出现弯曲等情况。 (这就是minitab四合一图中的一个)
同时可以根据正态概率图的斜率,判断两组样本的方差是否相等。如果明显不符合正态性假设,就可以考虑进行“数据转换”或者用非参数检验。

随机化设计是t检验中的重要方法,因为随机化就可以尽可能保证数据的正态性。所以“利用随机化设计可以检验假设,二无需对分布形式作任何假定”。
2.4.2 样本量的选取
2.4.3 置信区间
2.4.4 两总体方差不相等的情况
2.4.5 两总体方差已知的情况
2.4.6 均值和已知值的比较(这就是one-to-standard的比较)
2.4.7 总结
2.5 关于均值差的推断、配对比较设计(paired comparison design)
如果实验可以进行配对比较,可以极大的提高估计的精确度!因为配对比较可以排除很多的变异源!
配对实验设计,是一种特殊化的随机化区组设计。区组内部进行配对分析,区组之间依然保持弯曲随机。
通过区组化,区分开“区组内部的变异”和“区组之间的变异”,配对实验设计可以避免区组内部的变异干扰,从而提高比较的精确度。
书中聚了一个例子,要用一个设备的两个压头测试20块金属试片的硬度,如何判断两种压头是否等效。
一种方法就是完全随机,随机取出10片用压头一测试,随机取出10片用压头二测试,然后进行“两样本之间的均值对比”。
更好的比较方法是,同一块样品分别用两种压头测试,得到配对的两组数据,然后进行配对比较。
备注:配对比较其实是一种“one-to-standard”的均值与标准值的比较,均值就是配对数据的差值,而standard=0。所以在minitab中不一定用配对比较方法,直接比较差值的均值与0的关系即可。
2.6 正态分布方差的推断
除了比较样本之间的均值,还会比较样本之间的变异性(波动情况),答案是使用F检验。
2023-3-1 出差飞机上,阅读2.1-2.3以及2.4前半部分;2023-3-6 晚重读并简单整理2.1到2.3的内容,记录以加深理解。
2023-3-7 更新 2.4.1部分和更简单的2.5和2.6部分,暂时跳过2.4.2-2.4.7部分,这一些内容都可以直接用minitab软件实现。 发布