常用实验设计方法(DOE)介绍
实验设计介绍 Design Of Experiments(DOE)
进行实验设计的目的:
•快速达到最好的结果
•省略不必要的试验
•给最好的精确结果
•进展没有失败
•建立模型研究的现象
•发现最优解
常用试验设计方法和步骤
常用实验设计方法:
•析因设计(完全析因设计和部分析因设计)
•Plackett-Burman 设计
•正交设计、田口设计
•响应面设计方法
•中心复合设计
•Box-Behnken 设计
•正交设计、田口设计
•拉丁方设计
•交叉实验设计
•Etc…
以下分别进行介绍
一、析因设计
析因设计是科学研究中常用的设计方法,是一种包含各因素在各种水平下的处理组合的实验设计。在析因实验中,每一次完全试验或每一次重复中因素的所有可能的水平组合部被研究到。
析因设计实验可以是由水平数不相等的因素组成,更多的情况下,为了便于计算,往往选择水平数相等的因素进行实验。
k个2水平的因素的设计有处理组合,实验有观察值。共有 -1个效应(主效应、交互作用)
优点:数据丰富、全面。 缺点:试验次数多,耗资大
附加中心点的二水平析因设计
在利用二水平析因设计时,一个潜在的担心是因素效应的线性假设。当然,严格的线性是不需要的,甚至当线性假设仅仅相当近似的成立的时候, 系统也工作得很好,不过可以在实验中加中心点,提供弯曲性保护,且中心点不影响通常的效应估计量,能够得到独立的误差估计。
+n (n为中心点个数)
二、分式析因设计
应用特点:
1)尤其适用于筛查试验(有-无)
2)可以降低试验次数(以2水平二分之一分式析因设计为例,即2k -1 )
进行三因素,二水平全因子设计,则需及进行=8次试验,如果1/2分式析因设计,这只需要进行4次试验。
应用原理:
•效应稀疏原理(主效应和低阶交互作用为主要因素。)
•投影
•序贯试验
缺点:由于生成元的存在,例如别名l=A+BC 无法区分是由A还是BC交互作用造成的影响。
三、Plackett-Burman设计
1946年提出,适合于N次试验研究K=N-1个变量的二水平分式析因设计,其中N为4的倍数。一般N=4,8, 12,16, 20,24,28,36…
试验的生成:
可以将上表中的行作为第一行或列,第二行或列的产生是将前一行或列的第一个元素后移至最后,其它元素上移一格。
N小于8意义不大
如以下示例为N=8的实验设计表格
四、筛查实验常用的模型
五、响应面设计(Response surface method: RSM )
RSM的目的:
1)建立效应与各个变量间的数学关系;
2)在试验区域内或近边界附近进行效应预测;
3)继而进行优化
处于第二阶段(筛查实验之后)
响应面设计的数学模型和常用设计(以2因素为例)
•线性
•二次多项式(可以采用优化技术)
•三次以上比较少见
•分析:线性回归分析或者非线性回归分析
目的: 通过一定的实验设计使获得的试验 结果可以有效地使响应面数学模型近似真实的 设计方法。
RSM设计的策略:
数学模型的推论:线性模型比二次模型简单,需要的试验次数少,所以一般可以先假设为线性,如果出现弯曲再用二次多项式RSM设计。(序贯试验:爬坡法或者落地法。逐渐缩小优化区域,直至最优)
• 实验范围:RSM设计的边界可以是球形、
正方体或混合(圆柱体)的;RSM水平数:可以根据实际情况选择。
设计方法的选择:
•拟合一阶模型的设计 :析因设计 单纯形设计
•拟合二阶模型的设计: 中心复合设计 Box-Behnken设计
A、中心复合设计(Central composite design, CCD)
CCD是响应面方法中的一种重要的设计方法。CCD可以:
1,有效估计一次和二次项
2,通过向以前运行的因子设计中添加中心点和轴点,为带有弯曲的响应变量建模
中心复合设计在序贯实验中尤为有用,因为经常可以通过添加轴点和中心点与以前的因子试验进行模型构建工作。
CCD设计是多因素五水平的实验设计, 是在二水平析因设计的基础上加上极值点和中心点构成的。水平的代码:0, ±1, ±a
星点设计可旋转 (rotatable)——预测效应y的方差只是该点到中心点的距离的函数,与向量的方向无关。
序贯组装:先做中心对照的2水平析因设计或分式析因设计,然后加上星点或轴点。
设计点的选择:
中心复合设计由包含中心点的因子设计或部分因子设计组成,并用一组轴点(或星点)进行了增强,以便对弯曲进行估计。
上图从左到右分别为CCC、CCF、CCI的二因子平面和三因子(三维空间)中心复合设计示意图选择CCDs的指导原则:
1,优化点靠近设计空间的中心,设计的选择就不是关键的;
2,如果优化点位于设计域之外靠近轴向点时,一致精度和可旋转性就尤为关键。此时可选用CCC设计,具有旋转性。
3,当在CCC和CCF之间决策时,实验者必须知道是否CCC具有一致的预测误差,并且设计域的延申是否充分弥补由于附加了每个变量两个水平所增加的操作过程的复杂性。
六、正交设计(Orthogonal experimental design )
是研究多因素多水平的有一种设计方法,它是根据正交性从全面试验中挑选出部分具有代表性的点进行试验,是分式析因设计的一种主要方法,一种广泛应用的筛选实验方法。
日本统计学家田口玄一将正交试验选择的水平组合列成表格,称为正交表,用正交表来安排试验和分析试验结果,这种方法叫做正交试验法。
例如,一个3因素3水平试验,如果是全因子试验,则需要=27次试验,且尚未考虑每一组合的重复数 。若按L9(3)3正交表安排试验,则只需9次,按L18(3)7正交表,只需18次试验,大大减少了试验次数。
七、拉丁方设计
•拉丁方设计是按照拉丁方表进行实验的一种设计方法。所谓拉丁方表是一个有拉丁数字的表,如示例。
•特点:每行及每列各字母(处理)均出现一次。试验处理数=横行单位组数=直列单位组数=试验处理的重复数。
使用注意:
A)三个因素中有一个是关注因素,另外两个是非关注因素。
B) 三个因素的水平数必须相同,以关注因素的水平数为准。
C)三个因素之前不存在交互作用或交互作用可以忽略。
设计步骤
A)根据因素的水平数选定拉丁方表。
B)将选定拉丁方表随机化,即行、列交换。
C)规定行、列、字母代表的因素和水平
三因素五水平拉丁方表示例八、BOX-Behnken设计
响应曲面方法的另一种形式就是Box-Behnken设计。
其特点是将因子各实验点取在立方体每条棱的中点上。
1,边中心点用白色点表示。除了一维自变量坐标为0外,
其余维度自变量坐标皆为±1.在三因子时,共12个边中心点。
2,中心点用黑点表示。该点的三维坐标系为0.
优点:
•不包括顶点,与同等因子CCD相比,试验次数少。球面域,近似旋转性
•适合三水平,能够预估所有的主效应,二阶交互作用和各因子的平方项。
•如果实验前预估有曲率的发生,则很有效。
最大缺点:设计无序贯性,上批实验进行的数据几乎对下批试验没用。
九、交叉设计
指在同一试验中将试验单位分期进行、交叉反复二次以上的试验设计方法。在动物试验中,为了提高试验的精确性,要求选用在遗传及生理上相同或相似的试验动物,但这在实践中往往不易满足。为了较好地消除试验动物个体之间以及试验时期间的差异对试验结果的影响,可采用交叉设计法。常用的有2×2和2×3交叉设计试验。
交叉实验设计模式图我们在选择模型时,常常参考以下模型:
1)因子数≥8时,Plackett-Burman 设计,仅用于筛选试验,评价主效应
2)因子数为4~8时,部分析因设计
3)因子数为2~4,完全析因设计
4)因子数为2~3时,响应曲面设计
实验设计方法的确定,设计者应根据因素和水平以及研究目的具体分析。
常用实验设计软件:
Minitab
JMP
Design expert
spss
以上为个人分享,欢迎各位提出宝贵的建议和指正。