Presentation is loading. Please wait.

Presentation is loading. Please wait.

现代工业统计 南京财经大学统计系 2011~2012年第一学期.

Similar presentations


Presentation on theme: "现代工业统计 南京财经大学统计系 2011~2012年第一学期."— Presentation transcript:

1 现代工业统计 南京财经大学统计系 2011~2012年第一学期

2 第五章 试验设计与数据处理 第1节 从烹调咖啡谈起(爆米花制作) 第2节 试验设计的基本概念 第3节 正交试验设计方法概述
第1节 从烹调咖啡谈起(爆米花制作) 第2节 试验设计的基本概念 第3节 正交试验设计方法概述 (比较、正交试验设计法的基本概念 原则 表头设计 操作方法 分析) 第4节 正交设计与数据分析 1、无交互作用的正交设计与数据分析 2、有交互作用的正交设计与数据分析 4、有重复试验的情况 第5节 Minitab实践

3 试验设计的基本内容 单因素试验的设计与分析 区组设计 正交设计 饱和设计与超饱和设计 参数设计 回归设计 其他试验设计方法介绍

4 一个日常生活中的小案例 【场景】: 相信大家都吃过爆米花,但是大家是否都了解爆米花的制作过程?在品尝爆米花的时候,不知道您是否注意到有很多爆米花没有爆开,也有很多被爆焦。这两种情况都是生产过程中的质量缺陷。 要求基于本章和Minitab软件来实现我们的目标:寻找使用微波炉加工一包爆玉米花的更佳程序。 【分析】凭借经验,我们很容易就能确定重要因子的合理范围: 因子 水平(1, ) 加工爆玉米花的时间 (介于 3 至 5 分钟之间) 微波炉使用的火力 (介于 5 至 10 档之间) 使用的玉米品牌 (A 或 B)

5 在爆玉米花时,我们希望所有(或几乎所有)的玉米粒都爆开了,没有(或很少)玉米粒未爆开。因此 玉米的“爆开个数”是最终关注的重点。
求试验方案,最佳配制条件!

6 5.2 试验设计的基本概念 1、试验为什么要设计?试验设计有何作用? 2、何为试验设计? 9、试验设计的效果
2、何为试验设计? 、试验设计的效果 3、试验设计的由来 、常用试验设计与优化方法简介 4、中国的试验设计 11、试验设计方法分类 5、试验设计的内容 、单因素试验设计 6、如何进行试验设计?一般分几个阶段? 7、试验设计的基本原理(正交试验设计法、析因法 ) 8、一项试验设计有效必须在安排试验时注意事项 正交试验法(正交试验定义、正交表(构成、一般式、正交性)) 注:选择正交表的基本原则

7 无交互作用的正交设计与数据分析 一、试验的设计 二、进行试验和记录试验结果 三、数据分析 四、验证试验 例 磁鼓电机工艺条件试验

8 有交互作用的正交设计与数据分析 一、交互作用 二、试验的设计 三、数据分析 四、避免混杂现象 ~表头设计的一个原则

9 有重复试验的情况 1. 统计模型 2. 方差分析 例子与计算表 方差分算表

10 1、试验为什么要设计?试验设计有何作用? 试验设计会告诉我们如何安排试验最合理, 怎样对试验结果去评价、检验, 最终在科学研究和工业生产等诸多领域能够达到缩短时间、节约经费、提高效率, 创造更大价值的目的。 主要有:(1)提高产量;(2)减少质量的波动,提高产品质量水准;(3)大大缩短新产品试验周期;(4)降低成本;(5)试验设计延长产品寿命。 所谓试验的统计设计,就是设计试验的过程,使得收集的数据适合于用统计方法分析,得出有效的和客观的结论。 任一试验问题就存在两个方面:试验的设计和数据的统计分析。

11 试验设计的定义 目的在于回答一个或几个经过精心构思的问题的实践活动称为试验,又称为实验。
2、何为试验设计? 试验设计(Design Of experiment,DOE)也称为实验设计。试验设计是以概率论和数理统计为理论基础,经济地、科学地安排试验的一项技术。 试验设计的定义 目的在于回答一个或几个经过精心构思的问题的实践活动称为试验,又称为实验。 在明确所要考察的(可控)因子以其水平后对试验进行总体安排称为为试验设计。

12 3、试验设计的由来 试验设计自20世纪20年代问世至今,其发展大致经历了三个阶段:即早期的单因素和多因素方差分析,传统的正交试验法和近代的调优试验设计法。 4、中国的试验设计 60末期代,华罗庚教授在我国倡导与普及的“优选法”,如黄金分割法、分数法和斐波那契数列法等。数理统计学者在工业部门中普及 “正交设计”法 。 70年代中期,优选法在全国各行各业取得明显成效。 1978年,七机部由于导弹设计的要求,提出了一个五因素的试验,希望每个因素的水平数要多于10,而试验总数又不超过50,显然优选法和正交设计都不能用,随后,方开泰教授(中国科学院应用数学研究所)和王元院士提出 “均匀设计”法,这一方法在导弹设计中取得了成效。

13 均匀设计 方开泰教授

14 5、试验设计的内容包含 第一是明确衡量产品质量的指标,这个质量指标必须是能够量化的指标,在试验设计中称为试验指标,也称为响应变量 (response variable)或输出变量。
第二是寻找影响试验指标的可能因素(factor) ,也称为影响因子和输入变量。因素变化的各种状态称为水平,要求根据专业知识初步确定因素水平的范围。 第三是根据实际问题,选择适用的试验设计方法,试验设计的方法有很多,每种方法都有不同的适用条件,选择了适用的方法就可以事半功倍,选择的方法不正确或者根本没有进行有效的试验设计就会事倍功半。 第四是科学地分析试验结果,包括对数据的直观分析、方差分析、回归分析等多种统计分析方法,这些工作可以借助Minititab软件完成。

15 6、如何进行试验设计?一般分几个阶段? 试验设计一般分三个阶段: (1)试验:首先要明确试验的目的和要求;其次是合理选择试验考察的指标和影响因素(即因子);最后确定试验中影响因素的具体条件(即因子的水平)。 (2)设计:根据因子及因子的水平,确定试验方案;决定试验的顺序,试验的方法,测量的点数以及重复的次数等。 (3)分析:对试验所得到的数据进行整理,制成易于计算的表格,建立假设,计算分析用的各种统计量;确定显著性水平进行检验,得出结论。

16 7、试验设计的基本原理 试验设计有三个基本原理,它们是重复,随机化,以及区组化。 所谓重复,意思是基本试验的重复进行。 所谓随机化,是指试验材料的分配和试验的各个试验进行的次序,都是随机地确定的。 所谓区组化是用来提高试验的精确度的一种方法。

17 试验设计的作用 试验设计在工业生产和工程设计中能发挥重要的作用,主要有: 1.提高产量; 2.减少质量的波动,提高产品质量水准;
  1.提高产量;   2.减少质量的波动,提高产品质量水准;   3.大大缩短新产品试验周期;   4.降低成本;   5.试验设计延长产品寿命。 例如:在工农业生产中希望通过试验达到高质、优产、低消耗,特别是新产品试验,未知的东西很多,要通过试验来摸索工艺条件或配方。如何做试验,其中大有学问。试验设计得好,会事半功倍,反之会事倍功半,甚至劳而无功。

18 试验设计的三个基本原理是重复,随机化,以及区组化。
试验设计的基本原理 试验设计的三个基本原理是重复,随机化,以及区组化。 所谓重复,意思是基本试验的重复进行。重复有两条重要的性质。第一,允许试验者得到试验误差的一个估计量。第二,如果样本均值用作为试验中一个因素的效应的估计量,则重复允许试验者求得这一效应的更为精确的估计量。 所谓随机化,是指试验材料的分配和试验的各个试验进行的次序,都是随机地确定的。统计方法要求观察值(或误差)是独立分布的随机变量。随机化通常能使这一假定有效。把试验进行适当的随机化亦有助于“均匀”可能出现的外来因素的效应。 区组化是用来提高试验的精确度的一种方法。一个区组就是试验材料的一个部分,相比于试验材料全体它们本身的性质应该更为类似。区组化牵涉到在每个区组内部对感兴趣的试验条件进行比较。

19 8.一项试验设计有效必须在安排试验时注意事项
(1)尽量减少试验误差。 (2)尽量减少试验次数。 (3)便于对试验结果(即指标值)进行统计分析。

20 9、试验设计的效果 如何安排试验,有一个方法问题。不好的试验设计方法,即使做了大量的试验,也未必能达到预期的目的;一个好的试验设计方法,既可以减少实验次数,缩短试验时间和避免盲目性,又能迅速得到有效的结果。 10、常用试验设计与优化方法简介 常用的试验设计与优化方法主要有优选法、正交设计法、均匀设计法、人工神经网络等。 目前, 常用的方法主要有正交设计、均匀设计。

21 试验设计的效果 在质量管理中所遇到的,不论是设计新产品,还是改革旧工艺、提高产品质量、减低成本,大都需要做试验。
如何安排试验,有一个方法问题 不好的试验设计方法,即使做了大量的试验,也未必能达到预期的目的; 一个好的试验设计方法,既可以减少实验次数,缩短试验时间和避免盲目性,又能迅速得到有效的结果。

22 11、试验设计方法分类 常见的试验设计方法,按因素数量可分为二类,一类是单因素实验设计法,另一类是多因素实验设计法。这是按实验中的处理因素(即实验中所阐明的因素)的数量特点进行分类的。 常用的单因素实验方法有:0.618法等。多因素实验设计法包括双因素实验和多因素实验。常用的双因素实验方法有:爬山法等。 常用的多因素实验方法有:全面实验法、简单比较法、优选法、正交设计法、均匀设计法、单纯形优化法、双水平单纯形优化法、回归正交设计法、序贯试验设计法、人工神经网络等。

23 从实用角度,常见的多因素试验设计方法,可分为二类,一类是正交试验设计法,另一类是析因法。
◎正交试验设计法是研究与处理多因素试验的一种科学方法。它利用一种规格化的表格——正交表,挑选试验条件,安排试验计划和进行试验,并通过较少次数的试验,找出较好的生产条件,即最优或较优的试验方案。同时还可以作进一步的分析,得到比试验结果本身给出的还要多的有关各因素的信息。 ○主要用于调查复杂系统(产品、过程)的某些特性或多个因素对系统(产品、过程)某些特性的影响,识别系统中更有影响的因素、其影响的大小,以及因素间可能存在的相互关系,以促进产品的设计开发和过程的优化、控制或改进现有的产品(或系统)。

24 ◎析因法又称析因试验设计、析因试验等。它是研究变动着的两个或多个因素效应的有效方法。许多试验要求考察两个或多个变动因素的效应。例如,若干因素:对产品质量的效应;对某种机器的效应;对某种材料的性能的效应;对某一过程燃烧消耗的效应等等。将所研究的因素按全部因素的所有水平(位级)的一切组合逐次进行试验,称为析因试验,或称完全析因试验,简称析因法。 ○用于新产品开发、产品或过程的改进、以及安装服务,通过较少次数的试验,找到优质、高产、低耗的因素组合,达到改进的目的。

25 12、单因素试验设计 单因素试验设计法有优选法(0.618法)、对分法、均分法、分数法、抛物线法等,这里主要简介优选法,它曾是中国数学家华罗庚在1965年以后近二十年推广的双法(优选法、统筹法)之一,有广泛的群众基础。 优选法(0.618法)是以较少的试验次数,迅速地找到生产和科学实验的最优方案的单因素试验设计方法。华罗庚在推广双法。 适用范围: 1、怎样选取合适的配方,合适的制作过程,使产品质量最好。 2、怎样在质量标准下,使产品成本最低,生产过程最快? 3、已有仪器怎样调试,使其性能最好? 4、在合成配方、操作条件等方面应用。

26 1974年冬华罗庚在广西深入车间讲解优选法

27 从1958年起,他把数学方法创造性地应用于国民经济领域,筛选出了以改进生产工艺和提高质量为内容的“优选法”和以处理生产组织与管理问题为内容的“统筹法”(简称“双法”),他组织 “双法”推广小分队共去过26个省、自治区和直辖市, 所到之处,都掀起了科学实验与实践的群众性活动,取得了很大的经济效益和社会效益,取得了巨大的科普成就。华罗庚本人也因四处奔波而积劳成疾,1975年他在大兴安岭推广“双法”时,患上了心肌梗塞,为他的身体埋下了病根。

28 华罗庚教授深入农村推广优选法和统筹法。 华罗庚教授文革中深入农村推广优选法和统筹法。

29 华罗庚同湖北制药厂的工人在一起进行优选法的应用实验

30 华罗庚在山西推广“双法” 1973年华罗庚在哈尔滨汽轮机厂听取工人介绍应用统筹法取得的成果

31 1982年华罗庚在两淮煤矿现场与高层管理人员讨论开发方案
1984年华罗庚到长沙电信局修配厂指导推广“双法”

32 华罗庚应邀到广西推广双选法、统筹法期间参观南宁手扶拖拉机厂

33 【例5. 3. 1】铸铝件最佳浇铸温度的优选试验。某厂铸铝件壳体废品率高达55%,经分析认为铝水温度对此影响很大,现用0
【例5.3.1】铸铝件最佳浇铸温度的优选试验。某厂铸铝件壳体废品率高达55%,经分析认为铝水温度对此影响很大,现用0.618法优选。优选范围在690 ℃ ~740 ℃ 之间。 【解】: 第一点 = ( ) = 721 第二点 = – 721 = 709 因第一点合格率低,第三点 = – 709 = 702 比较第二、三点,这时又因第二点合格率低 第四点 = – 702 = 697 比较第三、四点,这时又因第三点合格率低 第五点 = = 695 如此下去直到精度满足为止。 0.618法要求试验结果目标函数f(x)是单峰函数,即在试验范围内只有一个最优点d,其效果f(d)最好,比d大或小的点都差,且距最优点d越远的试验效果越差。

34 进行全面实验法、简单比较法、正交设计法的比较讨论:
§5.3 正交试验设计方法概述 一、三种多因素试验设计法的比较 进行全面实验法、简单比较法、正交设计法的比较讨论: 【例5.3.1】 某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水平进行试验(见表5-1)。试验的目的是为提高合格产品的产量,寻求最适宜的操作条件。对此实例该如何进行试验方案的设计呢? 水平 因素 温度℃ 压力Pa 加碱量kg 符号 T p m 1 2 3 T1 (80 ) T2(100) T3(120) p1(5.0) p2(6.0) p3(7.0) m 1(2.0) m2(2.5) m3(3.0)

35 【解法1】很容易想到的是全面搭配法方案(如图5.3.1所示):
此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是实验次数多达33=27次(指数3代表3个因素,底数3代表每因素有3个水平)。因素、水平数愈多,则实验次数就愈多,例如,做一个6因素3水平的试验,就需36=729次实验,显然难以做到。因此需要寻找一种合适的试验设计方法。 图 全面搭配法方案 采用全面搭配法方案,需做27次实验。

36 固定T1和m2,改变p的三次实验如图5.3.2(2)所示,发现p=p3时的实验效果最好,因此认为因素p应取p3水平。
【解法2】那么采用简单比较法方案又如何呢? 先固定T1和p1,只改变m,观察因素m不同水平的影响,做了如图5.3.2(1)所示的三次实验,发现 m=m2时的实验效果最好(好的用­­ □ 表示),合格产品的产量最高,因此认为在后面的实验中因素m应取m2水平。 图 简单比较法方案 固定T1和m2,改变p的三次实验如图5.3.2(2)所示,发现p=p3时的实验效果最好,因此认为因素p应取p3水平。 固定p3和m2,改变T 的三次实验如图5.3.2(3)所示,发现因素T 宜取T2水平。 只需做9次实验。但必须指出,简单比较法方案的试验结果是不可靠的。

37 正交试验设计方法是用正交表来安排试验的。
只选择正交试验设计方法进行比较讨论。 【解法3】简单地说用正交表安排多因素试验的方法,称为正交试验设计法。其特点为:①完成试验要求所需的实验次数少。②数据点的分布很均匀。③可用相应的极差分析方法、方差分析方法、回归分析方法等对试验结果进行分析,引出许多有价值的结论。 试验号列号 因素 符号 1 2 3 4 温度℃ 压力Pa 加碱量kg T p m 5 6 7 8 9 1(T1) 2(T2) 3(T3) 1(p1) 2(p2) 3(p3) 1(m1) 2(m2) 3(m3) 正交试验设计方法是用正交表来安排试验的。 对于例5.3.1适用的正交表是L9(34),其试验安排见表5.3.2。

38 本例只需做9次试验。即使对如上述提到的6因素3水平试验,用全面搭配方案需729次,若用正交表L27(313)来安排,也只需做27次试验。

39 二、正交试验设计法的基本概念 (1)什么是正交试验设计? (2)正交试验设计法的用途 (3)正交表的由来 (4)正交实验法依据 (5)正交表
(6)正交表的构成 (7)正交表的正交性

40 (1)什么是正交试验设计? 正交试验设计是利用“正交表”进行科学地安排与分析多因素试验的方法。其主要优点是能在很多试验方案中挑选出代表性强的少数几个试验方案,并且通过这少数试验方案的试验结果的分析,推断出最优方案,同时还可以作进一步的分析,得到比试验结果本身给出的还要多的有关各因素的信息。

41 (2)正交试验设计法的用途 正交试验设计主要用于调查复杂系统(产品、过程)的某些特性或多个因素对系统(产品、过程)某些特性的影响,识别系统中更有影响的因素、其影响的大小,以及因素间可能存在的相互关系,以促进产品的设计开发和过程的优化、控制或改进现有的产品(或系统)。 (3)正交表的由来 正交表的来源正交拉丁方,而拉丁方名称的由来:古希腊是一个多民族的国家,国王在检阅臣民时要求每个方队中每行有一个民族代表,每列也要有一个民族的代表。数学家在设计方阵时,以每一个拉丁字母表示一个民族,所以设计的方阵称为拉丁方。

42 什么是n阶拉丁方? 答:用n个不同的拉丁字母排成一个n阶方阵(n<26 ),如果每行的n个字母均不相同,每列的n个字母均不相同,则称这种方阵为n×n拉丁方或n阶拉丁方。每个字母在任一行、任一列中只出现一次。 什么是正交拉丁方? 答:设有两个n阶的拉丁方,如果将它们叠合在一起,恰好出现n2个不同的有序数对,则称为这两个拉丁方为互相正交的拉丁方,简称正交拉丁方。

43 A B C A B C B C A 和 C A B C A B B C A 用数字替代拉丁字母:
例如:3阶拉丁方                  A B C                      A B C                  B C A        和          C A B                  C A B                      B C A         用数字替代拉丁字母:                  1  2  3                   1  2  3               (1,1)   (2,2)   (3,3)                  2  3  1       和        3  1  2     ---->  (2,3)   (3,1)   (1,2)                  3  1  2                   2  3  1               (3,2)   (1,3)   (2,1) (4)正交实验法依据 正交试验设计(Orthogonal experimental design)是研究多因素多水平的一种设计方法,它是根据正交表(即由正交性从全面试验中挑选出部分有代表性的点组成,这些有代表性的点具备了“均匀分散,齐整可比”的特点)进行试验,是一种高效率、快速、经济的实验设计方法。

44 日本著名的统计学家田口玄一将正交试验选择的水平组合列成表格,称为正交表。例如作一个三因素三水平的实验,按全面实验要求,须进行33=27种组合的实验,且尚未考虑每一组合的重复数。若按L9(34) 正交表安排实验,只需作9次,按L18(37) 正交表进行18次实验,显然大大减少了工作量。因而正交实验设计在很多领域的研究中已经得到广泛应用。        正交实验设计方法:依据伽罗华(Galois)理论,从大量的(实验)数据(测试例)中挑选适量的、有代表性的点(例),从而合理地安排实验(测试)的一种科学实验设计方法。类似的方法有:聚类分析方法、因子方法方法等。

45 L 8(41×24) (5)正交表 第一种、各列水平数均相同的正交表 L n(q p) 第二种、混合水平正交表
正交表的列数 每一列的水平数 实验的次数 正交表的代号 第二种、混合水平正交表 各列水平数不相同的正交表,叫混合水平正交表,下面就是一个混合水平正交表名称的写法: L 8(41×24) 2水平列的列数为4 4水平列的列数为1 实验的次数 正交表的代号

46 (6)正交表的构成 (7)正交表的正交性 正交表是有规律的,按顺序排成现成的表格,是正交试验的工具,正交试验是通过正交表进行的。 正交表具有正交性。 正交表的一般式。 正交表列数 因素数 正交表代号 L4(23) 正交表行数 代表试验次数 因素水平表 水平数 又如: 正交表的格式与特点

47 1、均衡分散性;每一列中各种字码出现相同的次数。
2、整齐可比性;任意两列中全部有序数字都出现相同的次数。 正交表的正交性

48 正交表的一般式 正交表是一种特别的表格,是正交设计的基本工具。 它是规格化的一种表,不能自己设计,只能选用。 正交表的代号 p为正交表的列数
(最多能安排的因素个数, 包括交互作用、误差等) 正交表的代号 q为各因素的水平数 (各因素的水平数相等) n为正交表的行数 代表试验次数

49 正交表(二水平七因素) 做8 次试验 最多考虑7 个因素 每个因素有2 个水平

50 正交表(二水平十五因素) 做16次试验 最多考虑15 个因素 每个因素有2 个水平

51 正交表(三水平四因素) 做9次试验 最多考虑4 个因素 每个因素有3 个水平

52 正交表(四水平五因素) 做16次试验 最多考虑5 个因素 每个因素有4 个水平

53 正交表(五水平六因素) 做25次试验 最多考虑6个因素 每个因素有5 个水平

54 三、选择正交表的基本原则 (1)先看水平数。 (2)每一个交互作用在正交表中应占一列或二列。 (3)要看试验精度的要求。若要求高,则宜取实验次数多的L表。 (4)若试验费用很昂贵,或试验的经费很有限,或人力和时间都比较紧张,则不宜选实验次数太多的L表。 (5)按原来考虑的因素、水平和交互作用去选择正交表,若无正好适用的正交表可选,简便且可行的办法是适当修改原定的水平数。 (6)对某因素或某交互作用的影响是否确实存在没有把握的情况下,选择L表时常为该选大表还是选小表而犹豫。若条件许可,应尽量选用大表。

55 四、正交表的表头设计 所谓表头设计,就是确定试验所考虑的因素和交互作用,在正交表中该放在哪一列的问题。 (1)若试验不考虑交互作用,则表头设计可以是任意的。如在例5.3.1中, 【例5.3.1】 某化工厂想提高某化工产品的质量和产量,对工艺中三个主要因素各按三个水平进行试验(见表5.3.1)。试验的目的是为提高合格产品的产量,寻求最适宜的操作条件。

56 (2)有交互作用时,表头设计则必须严格地按规定办事。这时避免混杂现象就是表头设计的一个原则。
在进行表头设计时,若一列上出现两个因子,或两个交互作用,或一个因子与一个交互作用时,称为混杂现象,简称“混杂”。当混杂现象所在列显著时,很难识别是哪个因子(或交互作用)是显著的,所以在表头设计时要尽量避免混杂现象的出现,这是表头设计的一个重要原则。只要选择较大的正交表,混杂现象是可以避免的。 由于在用正交表安排试验时,因子应与所在列的自由度相同,而交互作用所占列的自由度之和应与交互作用的自由度相同。因此根据表头设计避免混杂的原则,选择正交表时必须满足下面一个条件:“所考察的因子与交互作用自由度之和≤n-l”,其中n是正交表的行数。不过在存在交互作用的场合,这一条件满足时还不一定能用来安排试验,因为还可发生混杂现象,所以这只是一个必要条件。

57 【例5.3.2】给出下列试验的表头设计: ⑴A,B,C,D为二水平因子,且要考察交互作用A×B,A×C; ⑵A,B,C,D为二水平因子,且要考察交互作用A×B,C×D ⑶A,B,C,D,E为三水平因子,且要考察交互作用A×B。

58

59

60 (2)因素水平表排列顺序的随机化。如在例5.3.1中,每个因素的水平序号从小到大时,因素的数值总是按由小到大或由大到小的顺序排列。
五、正交试验的操作方法 (1)分区组。若试验指标的检验需要几个人(或几台机器)来做,为了消除不同人(或仪器)检验的水平不同给试验分析带来干扰,也可采用在L表中用一空白列来安排的办法。这样一种作法叫做分区组法。 (2)因素水平表排列顺序的随机化。如在例5.3.1中,每个因素的水平序号从小到大时,因素的数值总是按由小到大或由大到小的顺序排列。 从理论上讲,最好能使用一种叫做随机化的方法。所谓随机化就是采用抽签或查随机数值表的办法,来决定排列的别有顺序。 (3)试验进行的次序没必要完全按照正交表上试验号码的顺序。为减少试验中由于先后实验操作熟练的程度不匀带来的误差干扰,理论上推荐用抽签的办法来决定试验的次序。 (4)在确定每一个实验的实验条件时,只需考虑所确定的几个因素和分区组该如何取值,而不要(其实也无法)考虑交互作用列和误差列怎么办的问题。交互作用列和误差列的取值问题由实验本身的客观规律来确定,它们对指标影响的大小在方差分析时给出。 (5)做实验时,要力求严格控制实验条件。这个问题在因素各水平下的数值差别不大时更为重要。

61 六、正交试验结果分析方法 正交试验方法之所以能得到科技工作者的重视并在实践中得到广泛的应用,其原因不仅在于能使试验的次数减少,而且能够用相应的方法对试验结果进行分析并引出许多有价值的结论。因此,有正交试验法进行实验,如果不对试验结果进行认真的分析,并引出应该引出的结论,那就失去用正交试验法的意义和价值。 1、极差分析方法 列 号 1 2 3 试验指标yi 试验号 n=4 y1 y2 y3 y4 Ⅰj Ⅱj kj Ⅰj/ kj Ⅱj/ kj 极差(Dj) Ⅰ1=y1+y2 Ⅱ1=y3+y4 k1=2 Ⅰ1/ k1 Ⅱ1/ k1 max{ }-min{ } Ⅰ2=y1+y3 Ⅱ2=y2+y4 k2=2 Ⅰ2/ k2 Ⅱ2/ k2 Ⅰ3=y1+y4 Ⅱ3=y2+y3 k3=2 Ⅰ3/ k3 Ⅱ3/ k3

62 与极差法相比,方差分析方法可以多引出一个结论:各列对试验指标的影响是否显著,在什么水平上显著。
2、方差分析方法 若误差列由5个单列组成,则误差列的偏差平方和Se等于5个单列的偏差平方和之和,即:Se =Se1 +Se2 +Se3 +Se4 +Se5 ;也可用Se =S总 +S’来计算,其中S’为安排有因素或交互作用的各列的偏差平方和之和。 与极差法相比,方差分析方法可以多引出一个结论:各列对试验指标的影响是否显著,在什么水平上显著。

63 § 正交设计与数据分析

64 【例5.4.1】 合成氨最佳工艺条件试验。 根据以往生产积累的经验,决定选取的试验因素与水平如表5.4.2所示。假定各因素之间无交互作用。试验目的是提高氨产量,即要找到最高产量的最优的水平组合方案。 因素 水平 A反应温度(℃) B反应压力(大气压) C催化剂种类 1 460 250 2 490 270 3 520 300 解(1)选用正交表L9(34)安排试验 ,(2)进行表头设计 因素 A B C 空列 列号 1 2 3 4

65 例5.4.1的试验方案及试验结果直观分析 因素 列号 试验号 A B C 空白 产量 指标yi(t) 1 2 3 4 1(460)
1(250) 2(270) 3(300) 1(甲) 2(乙) 3(丙) y1=1.72 y2=1.82 y3=1.80 5 6 2(490) y4=1.92 y5=1.83 y6=1.98 7 8 9 3(520) y7=1.59 y8=1.60 y9=1.81 K1j K2j K3j y1+y2+y3=5.34 y4+y5+y6=5.73 y7+y8+y9=5.00 y1+y4+y7=5.23 y2+y5+y8=5.25 y3+y6+y9=5.59 y1+y6+y8=5.30 y2+y4+y9=5.55 y3+y5+y7=5.22 y1+y5+y9=5.36 y2+y6+y7=5.39 y3+y4+y8=5.32 =T/9 =1.786 K1j/3 K2j/3 K3j/3 1.780 1.910√ 1.667 1.743 1.750 1.863√ 1.767 1.850√ 1.740 1.787 1.797 1.773 R√ 0.73 0.36 0.33 0.07 因素主→次 A B C 优方案 A B C2 T= y1+…+y9 =16.07

66 例 磁鼓电机工艺条件试验

67

68

69 试验的设计 1. 明确试验目的 2. 明确试验指标 3. 确定因子与水平 4. 选合适的正交表,设计表头、列出试验计划 流程图 例子

70 流程图

71 例子

72 Minitab 中的田口设计试验以下步骤:
2    使用创建田口设计生成田口设计(正交表)。 3    创建设计后,可以使用修改设计来重命名因子、更改因子水平、向静态设计中添加信号因子、忽略现有信号因子(将设计作为静态设计处理)以及为现有信号因子添加新水平。 4    创建设计后,可以使用显示设计来更改 Minitab 在工作表中表示因子所用的单位(已编码或未编码)。 5    执行试验并收集响应数据。然后在 Minitab 工作表中输入数据。 6    使用“分析田口设计”分析试验数据 7    使用“预测结果”预测所选新因子设置的信噪比和响应特征。 上机演示

73 进行试验和记录试验结果

74 数据分析 1. 数据的直观分析 (1)寻找最好的试验条件 (2)各因子对指标影响程度大小的分析 (3)各因子不同水平对指标的影响图
1. 数据的直观分析 (1)寻找最好的试验条件 (2)各因子对指标影响程度大小的分析 (3)各因子不同水平对指标的影响图 数据的方差分析 (1)统计模型 (2)平方和分解 (3)F比 3. 最佳条件的选择与对应条件下指标均值的估计 方差分析表 计算表

75 计算表

76 方差分析表

77 在实际问题的分析中分析所得的最佳统计不一定在试验中出现,为此通常需要进行验证试验。

78 交互作用 交互作用:一个因子的水平的好坏或好坏的程度受另一因子水平的制约。 无交互作用的模型: 有交互作用的模型:

79 试验的设计 1. 明确试验目的 2. 明确试验指标 3. 确定因子与水平、可能存在的交互作用 4. 选合适的正交表,设计表头、列出试验计划
1. 明确试验目的 2. 明确试验指标 3. 确定因子与水平、可能存在的交互作用 4. 选合适的正交表,设计表头、列出试验计划 例子

80 例子 表头设计 依据:交互作用表

81 交互作用表

82 数据分析 1. 统计模型 2. 方差分析 3. 最佳条件的选择 例5.4.2 例5.4.4 方差分析表 计算表
直观(极差)分析+最优水平搭配 例5.4.2 直观+方差分析+最优水平搭配 例5.4.4

83 以例题为例 统计模型

84

85

86

87

88

89

90

91

92

93 计算表

94 方差分析表

95

96

97

98

99

100

101

102 对于 均值 的方差分析 来源 自由度 Seq SS Adj SS Adj MS F P A B C A*B A*C B*C 残差误差 合计

103

104

105

106

107

108

109 避免混杂现象 表头设计的一个原则 所考虑的因子与交互作用自由度之和≤n-1 举例

110 所谓表头设计,就是确定试验所考虑的因素和交互作用,在正交表中该放在哪一列的问题。 1.有交互作用时,表头设计则必须严格地按规定办事。
正交表的表头设计 所谓表头设计,就是确定试验所考虑的因素和交互作用,在正交表中该放在哪一列的问题。 1.有交互作用时,表头设计则必须严格地按规定办事。 例1 乙酰胺苯磺化反应试验 试验目的:希望提高乙酰胺苯的收率 因素和水平:有四个二水平的因素(见表1) 表1 例1 因素和水平表 因素 反应温度/℃ 反应时间/h 硫酸浓度/% 操作方法 符号 A B C D 水平 1 A1=50 B1=1 C1=17 D1=搅拌 2 A2=70 B2=2 C2=27 D2=不搅拌

111 考虑到反应温度与反应时间可能会有交互作用,反应温度与硫酸浓度也可能有交互作用,两者可分别用代号A×B和A×C表示。试选择合适的正交表,并进行表头设计。
因为4个因素均为2水平,2个交互作用需占2列,为方差分析应至少留一个空白列作为误差列,所以可选择正交表L8(27) 此处,表头设计的重点是搞清各个交互作用该放在哪一列。 方法之一:使用附录8正交表L8(27)后面的“L8(27)二列间交互作用表”(见表4-7)。

112 因为考虑的交互作用是A×B和A×C,所以宜先考虑A、B、C及其交互作用的安排,暂不考虑D的安排。
表2 L8(2 7 ) 二列间交互作用表 列号 1 2 3 4 5 6 7 (1) (2) (3) (4) (5) (6) (7) 因为考虑的交互作用是A×B和A×C,所以宜先考虑A、B、C及其交互作用的安排,暂不考虑D的安排。

113 表3是本例题表头设计的结果。 其中 方案1的思路为:① 先将因素A、B分别放在第1、2列。② 第1列和第2列的交互作用A×B该放在哪一列?在表2所示的L8(27)二列间交互作用表中,从最左边的列号“(1)”向右画水平线,从最上面的列号“2”向下画垂直线,所画两直线交点处的“3”就是交互作用A×B的列号。③将因素C放在第4列。④ 第1列和第4列的交互作用A×C该放在哪一列?由L8(27)二列间交互作用表知,A×C应放在第5列。⑤ 因素D该放在哪一列?因为无与D有关的交互作用,故放在第6或第7列均可。 方案2的思路为:① 将A、B分别放在第7、6列。② 由L8(27)二列间交互作用表知第6、7的交互作用A×B应放在第1列。③ 将C放在第5列。④ 将第5、7列的交互作用A×C放在第2列。⑤ 将D放在第4列或第3列均可。

114 2. 若试验不考虑交互作用,则表头设计可以是任意的。例如:在例4-1中,对L9(34)的表头设计,表5所列的各种方案都是可用的。
表4 例1 的表头设计结果 第1列 第2列 第3列 第4列 第5列 第6列 第7列 方案1 A B A×B C A×C D 误差 方案2 2. 若试验不考虑交互作用,则表头设计可以是任意的。例如:在例4-1中,对L9(34)的表头设计,表5所列的各种方案都是可用的。 表5 L9(34)表头设计方案 列号 1 2 3 4 方案 A B C ……

115 例子

116 以例题为例 统计模型

117 例子与计算表

118 方差分析表

119 选择正交表的基本原则 一般都是先确定试验的因素、水平和交互作用,后选择适用的L表。在确定因素的水平数时,主要因素宜多安排几个水平,次要因素可少安排几个水平。 在选择L表时: 1.先看水平数。若各因素全是2水平,就选L*(2*)表;若各因素全是三水平,就选L*(3*)表。若各因素的水平数不相同,就选择适用的混合水平表。 2.每一个交互作用在正交表中应占一列或二列。要看所选的正交表是否足够大,能否容纳得下所考虑的因素和交互作用。为了对试验结果进行方差分析或回归分析,还必须至少留一个空白列,作为“误差”列,在极差分析中可作为“其它因素”列处理。 3.要看试验精度的要求。若要求高,则宜取实验次数多的L表。

120 4.若试验费用很昂贵,或试验的经费很有限,或人力和时间都比较紧张,则不宜选实验次数太多的L表。
5.在按原考虑的因素、水平和交互作用去选择正交表,无正好适用的正交表可选时,简便且可行的办法是适当修改原定的水平数。 6.在某因素或某交互作用的影响是否确实存在没有把握的情况下,选择L表时常为该选大表还是选小表而犹豫。若条件许可,应尽量选用大表,让影响存在的可能性较大的因素和交互作用各占适当的列。某因素或某交互作用的影响是否真的存在,留到方差分析做显著性检验时再做结论。这样既可以减少试验的工作量,又不致于漏掉重要的信息。


Download ppt "现代工业统计 南京财经大学统计系 2011~2012年第一学期."

Similar presentations


Ads by Google