主题:【讨论】实验设计的三要素和六原则

浏览0 回复14 电梯直达
liu8373
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
众所周知,科研工作者在进行医药方面的科学研究之前,需要制定完善的统计研究设计

方案,那么什么样的设计方案才称得上是完善的呢? 一般来说,完善的设计方案需具备以

下几个条件:实验所需的人力、物力和时间资源;实验设计的“三要素”和“六原则”均符

合专业和统计学要求,对实验数据的收集、整理、分析等有一套规范的规定和正确的方法。

而其中准确把握统计研究设计的“三要素和六原则”,是科学实验设计的核心。

一、实验设计的“三要素”

1) 实验对象。实验所用的材料即为实验对象。实验对象选择的合适与否直接关系到实验实

施的难度,以及别人对实验新颖性和创新性的评价。一个完整的实验设计中所需实验材料的

总数称为样本含量。最好根据特定的设计类型估计出较合适的样本含量。样本过大或过小都

有弊端。

2) 实验因素。所有影响实验结果的条件都称为影响因素,实验研究的目的不同,对实验的

要求也不同。影响因素有客观与主观,主要与次要因素之分。研究者希望通过研究设计进行

有计划的安排,从而能够科学地考察其作用大小的因素称为实验因素(如药物的种类、剂量、

浓度、作用时间等);对评价实验因素作用大小有一定干扰性且研究者并不想考察的因素称

为区组因素或称重要的非实验因素;其他未加控制的许多因素的综合作用统称为实验误差。

最好通过一些预实验,初步筛选实验因素并确定取哪些水平较合适,以免实验设计过于复杂,

实验难以完成。

3) 实验效应。实验因素取不同水平时在实验单位上所产生的反应称为实验效应。实验效应

是反映实验因素作用强弱的标志,它必须通过具体的指标来体现。要结合专业知识,尽可能

多地选用客观性强的指标,在仪器和试剂允许的条件下,应尽可能多选用特异性强、灵敏度

高、准确可靠的客观指标。对一些半客观(比如读pH 试纸上的数值)或主观指标(对一些

定性指标的判断上),一定要事先规定读取数值的严格标准,只有这样才能准确地分析自己

的实验结果,从而也大大提高了自己实验结果的可信度。
该帖子作者被版主 职业游民3积分, 2经验,加分理由:比较经典
为您推荐
您可能想找: 气相色谱仪(GC) 询底价
专属顾问快速对接
立即提交
可能感兴趣
liu8373
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
二、实验设计的“六原则”

1)随机原则:即运用“随机数字表”实现随机化;运用“随机排列表”实现随机化;运用

计算机产生“伪随机数”实现随机化。 尽量运用统计学知识来设计自己的实验,减少外在

因素和人为因素的干扰。

2)对照原则:空白对照组的设立——只有通过对照的设立我们才能清楚地看出实验因素在

当中所起的作用。当某些处理本身夹杂着重要的非处理因素时,还需设立仅含该非处理因素

的实验组为实验对照组;历史或中外对照组的设立一一这种对照形式应慎用, 其对比的结

果仅供参考,不能作为推理的依据;多种对照形式同时并存。

3)重复原则:所谓重复原则,就是在相同实验条件下必须做多次独立重复实验。一般认为

重复5 次以上的实验才具有较高的可信度。

4) 平衡原则:一个实验设计方案的均衡性好坏,关系到实验研究的成败。应充分发挥具有

各种知识结构和背景的人的作用, 群策群力,方可有效地提高实验设计方案的均衡性。在

实验设计的过程中要注意时间上的分配,只有在时间上分配好了,才不会出现一段时间特别

忙而一段时间特别闲的情况。

5) 弹性原则:所谓空格,指的是在时间分配图上留有空缺。适当的空缺是非常必要的,只

有这样才能富有弹性的实施实验计划,并不断地调整好自己的实验进度。

6) 最经济原则:不论什么实验,都有它的最优选择方案,这包括在资金的使用上,也包括

人力时间的损耗上,必要时可以预测一下自己实验的产出和投入的比值,这个比值越大越好,

当然是以你所拥有的实验条件作基础的。

正确运用试验设计方法
liu8373
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
一 试验设计概述

在工农业生产和科学研究中,经常需要做试验,以求达到预期的目的。例如在工农业生产中

希望通过试验达到高质、优产、低消耗,特别是新产品试验,未知的东西很多,要通过试验

来摸索工艺条件或配方。如何做试验,其中大有学问。试验设计得好,会事半功倍,反之会

事倍功半,甚至劳而无功。

20 世纪30 年代r.a.fisher 把试验设计用于农业取得空前成功起,试验设计对微观经济及

管理做出了重大贡献。50 年代美国戴明把试验设计传到日本,用来减少产品性能异性以提

高产品质量,影响整个日本工业界。而60 年代日本田口玄一将正交设计表格化,极大改

善了试验设计,并引入全面质量管理,大大提高了日本产品在国际上的声誉和竞争力。80

年代,许多美国公司引进田口玄一方法,对美国研制新产品起了推动作用。中国统计工作者

在应用中,开发研制了许多适合中国国情的方法,推广项目达数万项,经济效益累计达十几

亿元以上,而且节省了大量的人力、物力。

近年来,新技术、新材料、新工艺等大量新生事物的出现,为各行各业带来了新的机遇。同

时,在新技术、新材料、新工艺的试用和使用中,也给我们带来了新的挑战,这就需要我们

工程技术人员必须掌握科学的试验设计方法并应用于新生事物的研究、试验、开发中,这样

才有利于新生事物的推广和应用,而正交最优化试验设计方法无疑是我们的最佳选择之一。

试验设计在工业生产和工程设计中能发挥重要的作用,例如:

1)提高产量;

2)减少质量的波动,提高产品质量水准;

3)大大缩短新产品试验周期;

4)降低成本;

5)延长产品寿命。

在自然科学中,有些规律开始尚未由人们所认识,通过试验设计可以获得其统计规律,在此

基础上提出科学猜想,这些猜想促进了学科的发展,例如遗传学的许多发现都藉助于上述过

程。
liu8373
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
二 正交试验设计简介

 试验安排得好,试验次数少且能获得满意的结果,多快好省,事半功倍,反之则事倍功半。

 举例来说:若影响质量指标的因素有ABC 3 种因素,每个因素各取3 个水平,分别

A1A2A3B1B2B3C1C2C3.(所谓因素的水平即该因素在其试验范围内取

具有代表性的,三水平就是有代表性的3 "",水平有时不限于数值,它可以是原料

的种类或操作方式等等)。按传统的方法采用单因素轮换法安排试验:譬如因素B 固定在B1

水平上,因素C 固定在C1 水平上,试验安排为,如果试验结果发现在A3 水平较好,则

安排试验 ,这时发现B2 较好,以后就安排 ,如果发现 C3 较好,那么A3B2C3 为最佳条

件,这种试验安排的缺点是:①考察的因素水平仅局限于局部区域,不能全面地反映因素的

全面情况,找不出影响质量的主要因素,无法再在三水平外继续找更好的配比组合(水平)

②如果不进行重复试验,试验误差就估计不出来,因此无法确定最佳分析条件的精度。当然,

我们可以用全面试验法按它们所有可能组合的情况做试验,则需做3327 次试验,对各因

素进行全面考虑,从中选出最优化条件,但这种作法很不经济,有时是不可能实现的。例如

安排5 个因素的3 水平的全面试验需做35243 次,这在人力、物力、时间上是几乎不可

能执行的。因此,我们很自然地会提出下列问题:如何从大量的试验点中挑选适量的具有代

表性、典型性的点呢?特别是怎样选择试验次数尽量少而又有代表性的试验呢?利用根据数

学原理制作好的规格化表--正交表来设计试验不失为一种上策,这种设计方法被称为正交最

优化,即正交试验设计方法。事实上,正交最优化方法的优点不仅表现在试验的设计上,更

表现在对试验结果的处理上。

还以前面提到过的三因素三水平的项目为例,是否同样做9 次试验,可以完全克服单因素

轮换法安排试验的诸多缺点,且能选出影响质量的最主要因素,便于进一步试验呢?回答是

肯定的,这便是利用正交表,进行正交试验设计。表1 为三水平正交表中的一种,可以在

本例中应用。

1 中的水平123 分别为各自所在的列对应的因素的第1、第2、第3 水平。我们以试

6 为例说明每一个试验是如何组成的:实验6 是由因素A 取第二水平A2、因素B 取第三

水平B3、因素C 取第一水平C1 所组成的,其余各组试验以此类推。这9 个试验安排得好,

每个因素中每一个水平都有3 个试验,正是由于它们搭配得均匀,所以任一因素的任一水

平与其它因素的每一水平相碰一次,且仅相碰一次。正因为如此,才便于对试验结果进行科

学分析。

有时候,利用正交设计试验得出的结果可能与传统的单因素轮换法的结果一致,但正交试验

设计更具有以下优势:①考察因素及水平合理、分布均匀。②不需进行重复试验,误差便可

估计出来,且计算精度高。③找出了最主要因素,便于进一步试验。④因素越多、水平越多、

因素之间交互作用越多,正交表的作用越大,而此时即使用单因素轮换法也几乎不可能实现。

因此,正交试验设计的使用具有广阔的天地(交互作用是指两个或两个以上因素同时作用时

对试验结果的影响,这个影响一般不等于各个因素单独作用所产生的影响之和。当需考察因

素之间的交互作用时,因素的排列是有讲究的。
liu8373
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
三 均匀试验设计及单纯形优化法简介

但随着电脑以及高新技术的快速发展,科学试验越来越复杂,也越来越昂贵,则要求大大减

少试验次数,且更加准确与推理性。 国际数理统计学会唯一的中国大陆院士方开泰教授与

著名数学家王元教授1978 年共同创造了均匀设计法,是一种最新的试验设计。多年来,

这一方法的应用在国内外生产与科研的众多领域,已取得丰硕成果和巨大经济效益,并得到

国际上一致好评此时。实际上,是对参与试验各个因素之间的内在关系进行数字仿真,从而

大大减少了试验,降低了试验成本,同时快速有效地优化了结果。均匀设计是一种全新的

试验设计方法,是模拟走向数字的突破。在工农业各类优化课题中已经发挥重要作用,

并取得巨大的经济效益。

.均匀设计的优点

1. 试验次数大大减少。例如某化工试验,欲找出最优产量或其它优化目标条件。试验因

3 个,每因素在取值范围内均有7 个试验点。  

采用优选法: 对多因素同时选优的试验,不适用。

采用正交法: 需做49 次试验,方可找出最优产量或其它优化目标条件。

采用均匀设计:只需做7 次试验即可。

2. 自动将各试验因素分类为重要与次要,并将因素按重要性排序。

3. 过程数字化,通过电脑对结果与因素条件进行界定与预报(如天气预报),进而控制各

因素。

.均匀设计的操作过程

1. 先由技术人员选出试验的关键因素,并确定各因素的取值范围及试验点;

2. 根据均匀设计选出适当的试验表

3. 按照表格规定的顺序做试验;

4. 电脑算出该试验的数学模型,再算出优化条件及优化结果 

.单纯形法优化法

1962 W.Spendley 等首先提出了基本单纯形优化法,1965 J.A.Nelder 等提出了改进单

纯形优化法,变固定步长为可变步长,并引入了反射,扩大与收缩规则,加速了优化过程.自此以

,不少学者从不同角度对单纯形优化法作了改进. 

单纯形优化法的特点是:计算简单,不受因素数的限制,当因素增多时,试验次数并不增加很多,

只需进行不多次数的实验就可找到最佳的试验条件.

与正交试验设计及均匀试验设计不同之处在于,每一次选用的试验条件是根据前一次实验的

结果来选定的,对试验条件逐步进行调整,最后达到优化,因此,它是一种动态优化方法.
liu8373
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
第四节 试验的因素和水平

在工业、农业、科学研究和军事科学的研究中,经常需要作各种试验,以研究各种因素

之间的关系,找到最优的工艺条件或最好的配方。

让我们先看一个例子:例1 在一个化工生产过程中,考虑影响得率(产量)的三个

因素:温度(A),时间(B)和加碱量(C)。为了便于试验的安排,每个因素要根据以往的经验

来选择一个试验范围,然后在试验范围内挑出几个有代表性的值来进行试验,这些值称做该

因素的水平。在该例中,我们选择的试验范围如下:

温度: 77.5℃~92.5-

时间: 75 分~165

加碱量: 4.5%7.5%

然后在上述范围内,每个因素各选三个水平,组成如下的因素水平表:

1 因素水平表

因素 1 2 3

温度( ) 80 85 90

时间(分) 90 120 150

加碱量(%) 5 6 7

选择因素和水平关系到一个试验能否成功的关键,下列的注意事项和建议对使用试验设计的

人员可能是有益的。

1.在一个生产过程中,有关的因素通常是很多的,例如在例1 的化工生产工艺中,有催

化剂的品种,催化剂用量,加碱时的速度,容器中的压力等。但根据这次试验目的,除了温

度(A),时间(B),和加碱量(C)各取三个水平外,其余因素是固定的,或者讲,他们

只取一个水平。为了方便,通常这些固定的因素在试验方案中并不称为因素,只有变化的因

素才称为因素。

2.在一项试验中,如何从众多的有关因子中挑选出试验方案中的因素?我们建议课题的领

导者应当要请有经验的工程师、技术员、工人共同讨论决定。在一次试验中,因素不宜选得

太多(如超过10 个),那样可能会造成主次不分,丢了西瓜,拣了芝麻。相反地, 因素也

不宜选得太少,(如只选定一、二个因素),这样可能会遗漏重要的因素,或遗漏因素间的交

互作用,使试验的结果达不到预期的目的。例如,有这样的故事,原计划试验方案中只有三

个因素,而利用试验设计的方法,可以在不增加试验数目的前提下,再增加一个因素,既然

不费事何乐而不为呢?试验的结果发现,最后添加的这个因素是最重要的,从而发现了历史

上最好的工艺条件,正是有心栽花花不成,无意插柳柳成荫。

3.试验的范围应当尽可能大一点。如果试验在试验室进行,试验范围大比较容易实现;如

果试验直接在生产中进行,则试验范围不宜太大,以防产生过多次品,或产生危险。试验范

围太小的缺点是不易获得比已有条件有显著改善的结果。历史上有些重大的发明和发现,是

由于事故而获得的,也就是说试验的范围大大不同于有经验的范围。

4.若试验范围允许大一些,则每一因素的水平个数最好适当多一些。

5.水平的间隔大小和生产控制精度是密切相关的。若在例1 中温度的控制只能作到 ±3,

且我们设定控制在85,于是在生产过程中温度将会在85°±3,82—88℃波动。不难看

到,这时设定的三个水平80,85,90℃之间是太近了,应当加大,例如80,90,100

℃。如果温度控制的精度可达±1,则例1 如设定的三个水平是合理的。

6.因素和水平的含意可以是广义的。例如五种棉花用于织同一种布,要比较不同棉花影响

布的质量的效应,这时棉花品种可设定为一个因素,五种棉花就是该因素下的五个水平 。
liu8373
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
第五节 因素的主效应和因素间的交互效应

根据试验的目的,要预先确定一项或多项试验指标,为简单计,本节仅讨论只有一项试验指

标(记作Y)的情形。如例如1 的试验Y 是得率。在数理统计中,称试验指标为响应(response

为通俗起见,本书中就叫试验指标。

考察一个因素对试验指标的影响是试验的目的之一。若在一项试验中,考察温度和得率Y

之间的关系,并取温度五个水平,其相应Y 值如下:

温度 5060708090

Y 30% 35% 40% 45% 50% 我们看到,温度每增加10℃得率增加5%5%就是温度的效

应。上述试验可以表成一个线性数学模型

(1.1) 其中为第 次试验结果, 为温度从50℃到90℃范围内Y 的平均值。通常可以用五次

试验的平均值来估计,记作 ,即 r 表示温度取第 个水平时 的值与之 差。不难发现,它

们的估计值为这里 称为温度在五个水平下的主效应, 为它们的估计值。 由于试验中总存

在一些偶然因素的干扰,如室温的变化,电压的波动,材料的不均匀性,这些偶然因素总称

为随机误差。由于试验误差的存在,不可能产生上例那么理想的情况。其实际数据可能为温

5060708090

Y 32% 34% 39% 46% 49% 这时数学模型为

(1.2)这里为第 次试验的试验误差。这时试验必须有重复才能估计出。实际上,当试验的

水平和相应的Y 为连续变量时,其数学模型也可以用回归方程来表达,例如,用线性回归

方程 (1.3) 其中X 表示温度, 和 是回归系数, 为随机误差。在第二章将介绍, 和 可

以用最小二乘法由试验数据估出, 由上述温度和得率的数据可得回归方程

(1.4)这里为试验结果Y 的估计值。利用方程(1.4)可以估出五次试验的结果如下:

30.8 35.4 40.0 44.6 49.2

1.2 -1.4 -1.0 1.4 -0.2

17 f?%?

其中 称为残差,它的大小反映了回归方程(1.4)的精确程度,并可用它作回归诊断。

方程(1.4)中,X 的回归系数0.46 有明确的实际含意,它表示温度每增加一度,其得率Y

均增加0.46%,于是0.46 反映了X Y 的效应,这里可以称为线性回归效应。

有一点是必须注意的,无论是模型(1.2)中的主效应 ,还是模型(1.3)中的线性回归效应 ,

都强烈地依赖于试验条件,尤其是X 的试验范围,也就是说,这两个模型只适用于X 的试

验范围内。否则,当X 210°时, 的估值为104.4%,这是不可能的,因为得率总是小于

100%的。

显然,模型(1.2)(1.3)是最简单的情形,实际情况是多种多样的,例如X Y 之间可能有

非线性回归关系,或其它相关关系。这些将在以后讨论。 ^f o ?

现在我们来介绍因素间交互作用的概念。首先,设有两个因素A B 它们各取两个水平 和 。

这时共有四种不同的水平组合,其试验结果列于图1。当 时, 变到 使Y 增加30-10=20

类似地,当 时, 变到 使Y 也增加40-20=20。这就是说A Y 的影响与B 取什么水平无

关。类似地,当B 从 变到 时,Y 增加20-10(或40-30=10),与A 取的水平无关。这时,

我们称A B 之间没有交互作用。判断和之间有没有交互作用,选用图2 的作图方法更为直

观。当图中的两条线平行时(或接近平行时),判断A B 之间没有交互作用.3 和图4

给出了一个有交互作用的例子,它们的含意和作图方法与图1 和图2 是一样的。
liu8373
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
交互作用在实际中是大量存在的,例如化学反应中催化剂的多少与其它成分的投入量通常是

有交互作用的。水中各种金属含量太多,对人体健康会造成危害,金属之间对人体的危害也

存在交互作用(参见例5)。

当因素AB 及其它们的试验指标Y 都为连续变量时,可以建立Y AB 之间的回归方

程。若回归方程为

1.5

时,A Y 的影响由回归系数完全决定,不受B 取哪个水平的影响;类似地,B Y 的影

响由回归系数γ 完全决定,不受A 取哪个水平的影响;类似地,对的影响由回归系数 完全

决定,不受取哪个水平的影响。这时A B 没有交互作用。

A B 之间有交互作用时,回归模型不可能为线性的,其中一定有非线性的。最常见的

模型之一为

1.6

其中 为回归系数, 为随机误差。这时若 >0,称A B 之间有正交互作用;若 <0,

A B 之间有负交互作用.请看如下两个例子 .

A=3.5,B=4.10 时,相应两个回归方程的试验指标列于图5 和图6。我们看到两种情形均

有交互作用,且一个为正交互作用,另一个为负交互作用。

两个因素之间有交互作用时,其回归模型不一定呈(1.6)形式,、

更详细讨论可参见第二章第三节。多个因素之间(超过二个因素)也可能有交互作用,该问题也将在第二章讨论。
liu8373
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
第六节 全面试验和多次单因素试验

在一项试验中,当因素和水平确定后,如何设计该项试验呢?下面两种方法是最容易想到的:

1、全面试验

该方法将每一个因素的不同水平组合做同样数目的试验,例如将每个因素的不同水平组合均

作一次试验。

在一项试验中若有m 个因素, 它们各有个水平, 则全面试验至少需做 次试验。例如,在例

1 中,则全面试验至少做 次试验。当因素的个数不多,每个因数的水平数也不多时,人们

常用全面试验的方法,并且通过数据分析可以获得较为丰富的结果,结论也比较精确。当因

数较多,水平数较大时,全面试验要求较多的试验。例如,有六个因素,每个因素都是五水

平,则至少需 次试验,这个数目太大了,对绝大多数场合,做这么多次试验是不可能的。

因此,我们需要一种试验次数较少,效果又与全面试验相近的试验设计方法。

这个方法在工程和科学试验中常被人们所采用,现以例1 来说明这个方法。例1 试验的目

的是要寻找好的工艺使得化学反应后的得率最高。为介绍简单计,设试验误差较小,故不作

重复试验(即在同一试验条件下将试验重复多次)。 设先将时间和加碱量固定,变化温度,

试验结果如下:

B90 808590

C5% 33% 70% 64%

其中33%70%64%为得率,三次试验中,以70%为最高,故温度85°为最佳。第二步

固定温度和加碱量,变化时间,其试验结果如下:

A=8590 120 150

C=5% 70% 73% 59%

以反应时间为120 分最佳。下一步是固定时间和温度,变化加碱量,获得如下结果:

A855% 6% 7%

B120 73% 75% 68%

以加碱量 75%为最佳,于是有人就得出结论:最佳工艺为A80℃,B120 分,C6%

当因素之间没交互作用时,这个结论是正确的;当因素之间有交互作用时,该结论一般不真,

今设例 1 的因素间有交互作用,在上述试验的基础上,若我们固定B120 分,C6%

变化因素 A 并获得如下结果:

B120 808590

C6% 46% 75% 78%

发现有更好的工艺条件。这时我们发现温度的效应是依赖于因素B C 的,当B90 ,C

 

5%时,温度以85℃为佳,而当B120 分,C6%时,温度以90℃为佳,这种现象表明

.

度和其他两因素间有交互作用。当因素间有交互作用时,用上述方法不一定能选到最好的工

艺条件。例如,例1 的试验应当继续按原来的方法做下去:

A9090 120 150

C6% 73% 78% 84%

发现工艺条件A90℃, B120 分,C6%为_______最优工艺条件且似乎已不能改进。如果我

们将27 个工艺组合进行全面试验,发现当工艺条件为A90℃,B150 分,C7%时得

率可达82%,而这个工艺条件没有为上面的试验方法所发现。因此,多次单因素试验法有

局限性。特别是,当因素的数目和水平数更多时,常常会得到错误的结论,不能达到预期的

目的。
zhz6688
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
liu8373
结帖率:
100%
关注:0 |粉丝:0
新手级: 新兵
原文由 zhz6688(zhz6688) 发表:
很不错的资料,能有附件就好了。


声望太低,传不上去啊
猜你喜欢最新推荐热门推荐更多推荐
品牌合作伙伴