试验设计DoE的三大原则:随机化、区组化、重复

本文要努力回答的问题是:DoE的原理是什么,DoE三大原则之间的异同是什么?

如之前所强调,试验设计(Design of experiments,DoE)的更完整表述是统计试验设计,或试验的统计设计(statistical design of experiments)。

统计是试验设计(DoE)的基石。

所谓实验的统计设计(statistical design of experiments),就是设计实验的过程,以便收集适合于用统计方法分析的数据,从而得出有效且客观的结论。如果想从数据中得出有意义的结论,那么用统计方法作实验设计是必要的,当问题涉及受实验误差影响的数据时,只有统计方法才是客观的(objective)分析方法。因此,任何实验问题就存在两个方面:实验的设计和数据的统计分析。这两个方面是紧密相连的,因为分析方法直接依赖于所用的设计。

《试验设计与分析》

统计的一个核心概念是”变异(variability)”,统计学的核心是理解、量化和控制变异。这在方差分析ANOVA,回归分析、试验设计DoE中都有所体现。

控制变异的思维,在试验设计DoE中的具体体现,就是试验设计的三大原则。

1. 随机化

2. 区组化

3. 重复

在具体描述之前,还需要强调的是,这些原则源自统计学家罗纳德·A·费希尔(Ronald A. Fisher)在20世纪20年代和30年代的农业科学试验的探索,这三大原则奠定了现代实验设计的基础。

试验设计的变异,包括可控和不可控变异两种。

对于可控变异,我们会将其分解到一系列的控制因子中,详细研究其效应;或者固定不变,比如固定试验的温湿度等条件。

对于不可控变异,并非真的”不可控”。如果我们发现了一个不可控变异的来源,一种办法是将它随机化,”平均掉“可能存在的、未纳入试验的影响因素,进而将其影响合并到”随机误差”中,避免系统性偏差。另外一种办法是将它区组化,将变异分离成区组间变异和区组内变异,前者相当于新的处理因子,后者则合并到”随机变异”中,区组内部再确保随机化,即为”区组随机化。当然第三种选择是直接忽略不计,

总而言之,随机化和区组化,都是控制不可控变异的好方法。

有时候实验者很难随机化实验的某一部分。如果我们对不可控变异有很好的了解(充分的knowhow),且系统性安排更容易使用(节约资源),则不进行随机化也是能接受的。除非有充分的理由,否则都要进行随机化。[1]

对于很难随机化的部分,比如化学反应的实验温度、比如涂布工艺的光强、比如试验的时间(上午下午,或者不同工作日),非常建议用区组化设计。

本质上,区组是一种类型变量或属性变量(category factor),特别是像《试验设计》中说的”排序定性因子”,比如涂布工艺的光强,先涂布低光强下的所有样品,再设置成高光强涂布所有样品。这样区组之间存在高低光强的系统性差异,而区组内不同光强之间的差异则被消除了。

关于随机化和区组化的区别,我认为有两点:

1. 区组化可以最小化试验的误差方差(纯误差),而随机化并不会减小,反而可能会增大试验的不可控变异。

2.优先选择区组化,其次再选随机化;也就是 “能分区组者则分区组,不能分区组者则随机化” (block what you can and randomize what you cannot) [3]

回到试验设计DoE的第三个原则——重复。重复是比随机化和区组化更基础的DoE原则。

所谓重复,是指每个因子水平组合的独立重复,一种方法是仿行,重复试验次数翻倍,很少使用;另外一种方法是中心点重复,一般重复2~5次。

重复的重要作用是,它允许实验者估计实验误差,进而判断一个因子不同水平之间的观测差是否统计意义。[1]  

参考资料:

[1]《试验设计与分析》

[2]《试验设计》

[3] 《六西格玛管理统计指南》 蓝皮书

2025-1-29 新年快乐