本文要回答的问题是,为什么我们要学习使用统计试验设计方法(DoE)。
主要内容:
1. 三种试验策略:最佳猜测法、一次一因子试验(OFAT)、统计试验设计DoE,及其优缺点;
2. OFAT的最大缺点是忽略了交互作用,而交互作用非常普遍;
3. DoE的三个优点:更少的试验次数,评估交互作用,基于模型寻找最优解
首先直接引用quality-one.com上的一段话”Why Utilize Design of Experiments (DOE)”,非常好的总结了DoE的目标、优势,并提及了DoE的高阶应用——稳健设计。
> DOE allows the experimenter to manipulate multiple inputs to determine their effect on theoutput of the experiment or process. By performing a multi-factorial or “full-factorial” experiment, DOE can reveal critical interactions that are often missed when performing a single or “fractional factorial” experiment. By properly utilizing DOE methodology, the number of trial builds or test runs can be greatly reduced. A robust Design of Experiments can save project time and uncover hidden issues in the process. The hidden issues are generally associated with the interactions of the various factors. In the end, teams will be able to identify which factors impact the process the most and which ones have the least influence on the process output.
人类在认识自然界的过程中,持续地进行着多方面的探索。试验是构成学习过程(learning process)的一个要素。通过试验的学习是一种综合了人们的期望、需要、知识和资源的复杂过程。在试验的统计设计方法开始形成的20世纪20年代以前,科技工作者在试验中走了不少弯路。[1]
世界最著名的发明家爱迪生一生艰苦奋斗,经历了无数次的失败之后,为人类发明了许多重要科技产品。他的座右铭是“天才靠的是百分之一的灵感和百分之九十九的汗水”。他的助手特勒撒(Nicola Telsa)于爱迪生去世后第二天在1931年10月19日的《纽约时报》发表纪念评论写道:“如果在爱迪生工作的黑屋中能有一支蜡烛照亮他前进的方向的话,以他蜜蜂般的勤奋,他将会获得远比他已发明的东西多得多的成果”。“我非常同情地观察到他的工作状况,但凡有一点点理论和计算能帮助他的话,将节省他百分之九十的精力”。爱迪生是靠苦干拼出来的,他是在边试验边分析后确定下次试验该怎么做的。这种方法速度太慢,而且只能从已经得到的偶然出现的好结果出发,摸索着前进,无法形成理论上的知识,无法预测何处将有更好的成果。这种凭直观猜测逐步探索的方法已经无法适应当代快速发展的需求了。[1]
设计和进行实验的一般方法称作实验策略,爱迪生使用的是第一种试验策略——最佳猜测法(best-guess approach),实践中被广泛采用。
最佳猜测法依赖于实验者的理论知识和实际经验(knowhow),所以对专家来说,该方法的使用效果通常相当好;而像爱迪生这样的勤奋,也是积攒knowhow的一种途径。
但是最佳猜测法也有很多的不足。第一,严重依赖于试验者的knowhow,这是最难传承的东西,也是专家的核心竞争力之一;第二,不同的试验之间,很难进行系统的量化分析,导致既有结果难以提炼模型和规律;第三,假定最初的最佳猜测产生了一个可以接受的结果,但是不能确认这是不是最优解。[2]
这种方法在爱迪生的时代或许可行,但在今天,面对复杂的工程问题和激烈的市场竞争,蛮力试验已经显得力不从心。
另一种在实际中被广泛应用的实验策略是一次一因子(one-factor-at-a-time,OFAT)方法。其做法是:多个因子中,每个因子依次改变,而其他因子则保持在固定或选定的水平上。[1]
OFAT有许多缺点:与统计试验设计方法相比,要达到同样的效应估计的精度,它需要更多的试验次数;它不能估计某些交互效应;它不能在试验区域内进行系统而全面的搜索,因而它的分析结论缺乏普遍性;它最后的结论对于固定因子的初始值的选定太敏感,因而可能错过最优的因子设置(如下两图所示)。这一方法现已弃之不用。[1]

值得反复强调的是,OFAT的最大缺点在于,它没有考虑因子间可能存在的交互作用(interaction)。交互作用会使一个因子与另一个因子的不同水平的结合使用对响应产生不同的效应。[1]
更重要的是,因子间的交互作用是非常普遍的。许多人没有意识到这一点,结果在实际中经常采用一次一因子实验.(有些人确实认为这个策略是一种科学方法,或者认为它“合乎”工程原理.)然而对设计而言,一次一因子实验往往比其他基于统计途径的方法效率更低。[2]
第三种试验策略,就是统计试验设计方法(statistical design of experiments),简称DoE。
DoE 是一种系统化的实验设计方法,可以同时调整多个因子,分析响应变化,建立经验模型(empirical model),高效分析多因子及其交互作用。
我们将全部因子全部水平的全部搭配都进行至少一次试验的安排方法称为全因子试验设计(full factorial design)。这是人们容易想到的一个方法,而且可以获得相当多的信息。但是,如果因子很多,比如8个甚至更多,全因子试验次数太多,既无法接受,也没有必要(效应稀缺原理)。统计设计工具可以指导我们,用最少的试验次数,获得尽可能多的信息。
试验完成之后,统计分析方法不但能从试验结果中找到最优值,而且可以判明哪些因子影响显著,哪些因子影响不显著,还可以得到有关的变化规律,预测将要达到的最佳值是多少和这个最佳值将在什么范围内波动,而这个最佳值可能根本未在我们的选定条件中试验过,这些就是统计分析方法的威力。[1]

在我看来,DoE至少有以下三项核心优势:
- 大幅降低试验次数:通过科学的实验设计,用最少的试验次数获得最多的信息。
- 量化交互作用:能够分析因子之间的相互影响,避免单因子变化法的局限性。
- 精准预测与优化:不仅能够找到最优解,还能预测未试验区域的最优值。
DoE是实验室科学(或工程)方法的一个重要组成部分,可以用于工艺过程优化、产品及配方开发、质量控制等。
从爱迪生的蛮力试验到现代 DoE,实验设计方法经历了巨大的进化。DoE 不仅能够大幅提升实验效率,还能帮助我们量化交互作用,精准预测最优结果。对于现代工程师来说,掌握 DoE 是一项必备技能。
如果您也想告别蛮力试验,提升实验效率,欢迎关注本公众号,获取更多 DoE 知识和实战案例。让我们一起,用科学的方法解决工程问题!
参考资料:
- 《六西格玛管理》红皮书 何桢 主编
- 《试验设计与分析》 Douglas C. Montgomery
2025-1-25