试验设计(DOE)是一完美的工具,有效地确定关键输入是否与关键输出有关。幕后,“DOE”只是一个简单的回归分析。然而,不简单的是当你计划你的实验时,你必须做出选择:你应该测试什么?您选择的X的范围应该是什么?你应该实验多少次?你需要中心点吗?等等,让我们先来谈谈中心点。
一、什么是中心点
中心点 - 表示所有因子水平都设置在低设置和高设置之间的中间位置时的试验。
这里有两个因子,每个因子两个水平。其中温度低水平为120℃,高水平为180℃,则温度的中间水平就是150℃。同理,时间低水平为10s,高水平为30s,则时间的中间水平为20s。而所谓的中心点就是这两个因子都取中间水平的一种组合,即(150℃,20s)。
你在Minitab统计软件的数据收集计划可能看起来像这样的东西,中心点显示为蓝色:
以上数据来自蓝宝书第三版506页,例13-4
注意:
代码化后,因子低水平设置为-1,高水平设置为1,中心点设置为0。真正的中心点只能与在选择的两个水平之间的中点处设置的数字因子一同使用。如果您具有类别因子与数字因子的组合,则 Minitab 将创建伪中心点。这些点是类别因子水平的每个组合位置处的数字因子的中心点。顺便提一下,取最高水平或最低水平上设置时的试验点,称为角点。
二、中心点有什么用?
首先,我们要认识到实验设计的三个基本原则:完全重复、随机化和区组化。重复实验中,MSE包含纯的仿行误差,它提供了试验变异的最好估计。如何实现“完全重复试验”呢?一种办法就是将每个试验条件都重复 2次或更多次,这样做的好处是对于试验误差估计得更准确了,但代价却是大大增加了试验次数因而增加了试验成本。另一种更巧妙的办法就是只在“中心点”处安排重复试验,通常是在中心点重复做3次或4次试验。
下面我们就来看看中心点的好处。
1. 根本目的: 提高对实验误差的精确估计,确保有(足够的)自由度分析实验误差。
对于自由度的问题,我在上一篇文章中做了一些阐述,在这里我们要强调的是自由度是否足够,顺便讨论一下在模型中要不要包含中心点。(我们以上面的数据为例,模型中最终只有A、B、D和BD是显著的)。
a. 在模型中包含中心点
当模型中包含中心点时,从以上三张图,我们可以发现以下两点:
弯曲项自由度不包含在误差项中,误差项的自由度为13;效应Pareto图上的临界值为2.16.b. 在模型中不包含中心点
当模型中不包含中心点时,从以上三张图,我们可以发现以下两点:
弯曲项自由度包含在误差项中,误差项的自由度为14;效应Pareto图上的临界值为2.145.我们再来看看效应Pareto图上的红色参考线是怎么来的。
有了以上结论,那么就有一个问题:如果误差自由度不为0(如果为0,请看上一篇文章)但又不够会发生什么呢?这时候效应Pareto图中的红色参考值会变大,而我们比较项是否显著是与把各种项的t值与红色参考值进行比较,如果这个参考值由于误差自由度不够而变大会使得本应该是显著的项而判断为不显著。
所以,拟合模型时不要包含中心点,确保有足够的自由度来估计实验误差。
2. 辅助判断实验环境是否发生大的变化。
中心点处各因子的水平相同,如果实验是在稳定的环境下完成的,这三个响应值应该大致相同。在把因子点试验的顺序随机化之后,如果再把在中心点处所进行的3次试验安排在全部试验的开头、中间和结尾,那么这几个点的试验结果间只应存在随机误差。如果这几个试验结果呈现非常明显的上升、下降或其他不正常的趋势,则有可能帮助我们发现在试验过程中出现的不正常状况。
这里,我们可以借助散点图来分析这个问题:
从以上图上看出,没有非常明显的上升和下降趋势(虽然有一点上升趋势)。
3. 检查模型是否存在弯曲,是否有必要做响应曲面设计(RSM)。
因子设计假设每一个X和Y之间有一个线性关系,因此,如果任何X和Y之间的关系表现出曲率,你不应该使用一个因子设计,因为结果可能会误导你。那么,你如何统计确定这种关系是否是线性的呢?有中心点就不用担心了!如果中心点的值是显著的(即,小于α),那么你可以得出这样的结论:存在弯曲并考虑使用响应曲面试验(如中心复合设计)来分析你的数据。虽然因子设计可以检测曲率,但你必须使用一个响应面设计模型(建立一个方程)的曲率。
4. 相当于三水平的设计,提高模型的精度。
原来只有高低两个水平,加了中心点后,相当于三水平的设计,可提高模型的精度。
对于中心点的分析我们今天就讲到,里面还有很多问题没有展开:为什么效应Pareto图中的参考值用的是t分布来计算、模型弯曲显著是不是一定得要做RSM,模型弯曲不显著是不是一定不需要做RSM……