试验设计方法 课程综述
多次反复试验 提高产量 提高产品性能 试验数据分析 降低成本能耗 规律研究 科研成果产生流程 新产品、新工艺、新材料、新品种及其他科研成果产生流程 多次反复试验 提高产量 提高产品性能 试验数据分析 降低成本能耗 规律研究
实验 试验 科研工作的必要手段——试验 实验和试验 shí yàn shì yàn 已知某个结论去验证 未知某个结论去探索 已知方法的操作 验证性 shì yàn 试验 未知某个结论去探索 未知方法的探索 探索性
试验设计方法起源 1980s 1920s 1949 1935 1980s 美国引进田口方法 1920s Fisher用于田间试验 1924~2012 1920s 1980s 美国引进田口方法 1949 1920s Fisher用于田间试验 Statistical Experiment Design 1920s Tippett将SED用于棉纺 1940s末 美国Deming传播SED至日本 1949 日本Genichi Taguechi(田口玄一)以SED为基础建立“正交试验设计”法 1952 应用L27(313)于日本东海电报公司 1952~1962 应用100万项,1/3成效明显 1955~1970 日本借此推行全面质量管理 1935 1935 “Design of Experiments” 试验设计成为应用技术科学 1930~40s 英、美、苏用于工业
我国试验设计方法发展 1978 范福仁《田间试验之统计与分析》 1970.4 华罗庚推广优选法、统筹法 1978 优选法用于五粮液获成功 1948 王元 1930~ 方开泰 1940~ 华罗庚1910~1985 1970 1970.4 华罗庚推广优选法、统筹法 1978 优选法用于五粮液获成功 1978 方开泰、王元创建均匀设计法
试验设计方法是一项通用技术,是当代科技和工程技术人员必须掌握的技术方法。 试验设计方法是自然科学研究方法论领域中的一个成熟分支学科。 课程性质与任务 试验设计方法是一项通用技术,是当代科技和工程技术人员必须掌握的技术方法。 试验设计方法是自然科学研究方法论领域中的一个成熟分支学科。 让本科生掌握试验设计的基本原理,近代最常用的正交试验设计方法的原理及其应用方法,可以用在以后研究过程中。
试验设计方法是国内外许多重点大学化学、化工、电子、机械、材料包括管理等类专业的专业技术基础课程。 课程性质与任务 试验设计方法是国内外许多重点大学化学、化工、电子、机械、材料包括管理等类专业的专业技术基础课程。 试验设计的目的是使要我们用科学的方法去安排试验,懂得如何处理得到的试验结果,以最少的人力和物力消耗,在最短的时间内取得更多、更好的生产和科研成果的技术方法。
试验设计一般分三个阶段: (1)试验:首先要明确试验的目的和要求;其次是合理选择试验考察的指标和影响因素(即因子);最后确定试验中影响因素的具体条件(即因子的水平)。 (2)设计:根据因子及因子的水平,确定试验方案;决定试验的顺序,试验的方法,测量的点数以及重复的次数等。
(3)分析:对试验所得到的数据进行整理,制成易于计算的表格,建立假设,计算分析用的各种统计量;确定显著性水平进行检验,得出结论。 概率论与数理统计
什么叫做优化试验设计方法 什么叫做优化试验设计方法? 数理统计 把数学上优化理论、技术应用于试验设计中,科学的安排试验、处理试验结果的方法。 采用科学的方法去安排试验,处理试验结果,以最少的人力和物力消费,在最短的时间内取得更多、更好的生产和科研成果的最有效的技术方法。 数理统计 现有数据的分析
试验研究 试验设计 试验实施 数据整理 数据分析 优化试验设计在科学研究中的地位与意义 : 1.试验设计方法是一项通用技术,是当代科技和工程技术人员必须掌握的技术方法。 2.科学地安排实验,以最少的人力和物力消费,在最短的时间内取得更多、更好的生产和科研成果。简称为:多、快、好、省。
如何进行科学合理的试验设计 如何进行科学合理的试验设计 优良的试验方案 遵循试验设计基本原则,控制试验误差 简单计算获取有价值试验规律 试验研究结果可推广和重复
在开发的早期应用试验设计方法能得出以下成果 试验设计的意义 应用数理统计学的基本知识,讨论如何合理地安排试验、取得数据,然后进行综合科学分析,从而尽快获得最优组合方案。在工程学领域是改进制造过程性能的非常重要的手段。在开发新工序中亦有着广泛的应用。 在开发的早期应用试验设计方法能得出以下成果 1.提高产量; 2.减少变异性,与额定值或目标值更为一致; 3.减少开发时间; 4.减少总成本;
试验设 计效果 试验设计解决的问题 因素对指标影响大小 B 因素对指标影响规律 因素间是否相互影响 A C 优选最佳条件,估计指标值 E D 估计和控制试验误差 试验设计方法可以解决以上5个问题
什么是试验设计? 问题1:有12个外表一致的小球,其中11个的质量都是10克,另一个要重一些(但仅凭手感无法分辨),给定一个没有砝码的天平,请你设计一个试验方案,把这个重一点的小球挑出来。
方案一: 方案二: 把12个球平均分成六组,把同组的两个球分放在天平两边,如果不平衡,则较重一边的小球就是要找的。 先把两个球放到天平两边的盘中,如果不平衡,则较重一边的小球就是要找的;如果平衡,就把其中一个球(哪个都行)作为标准,用它称量其它球,与它不同的就是我们要找的。 这种方法在最糟糕的情况下,可能需要10次称量才能完成任务。 方案二: 把12个球平均分成六组,把同组的两个球分放在天平两边,如果不平衡,则较重一边的小球就是要找的。 这种方法在最糟糕的情况下,需要称量6次。
方案三: 12个球平均分成3组(每组4个),先把其中两组分别放到天平两边。如果平衡,则重一点的球一定在剩余一组中;如果不平衡,那么较重一边的四个球当中就一定有我们要找的那个球。 可见,只称量一次,就排除了8个球。下面可以按照方法(二)中的办法,最多再需两次就可以完成任务。 这种方法最多只需要称量3次。 不难看出,试验是需要设计的,如果试验方案选择的好,试验次数就可以减少。
什么是试验设计? 问题2:洗衣服一般分为洗涤和漂洗两个阶段。假设衣服洗涤并拧干以后还残留含有污物的水1千克,用20千克清水来漂洗。比较下面四个方法哪一个能洗得更干净一些? 方案1:一次漂洗,用20千克水 方案2:分两次漂洗,第一次用5千克水,第二次用15千克水 方案3:分两次漂洗,第一次用15千克水,第二次用5千克水 方案4:分两次漂洗,第一次用10千克水,第二次用10千克水
方案1——一次漂洗 方案2、3——二次漂洗 方案4——二次漂洗 常见试验方案设计 把衣服一下子放到20千克清水中,连同衣服上那1千克污水,一共21千克水。污物均匀分布在这21千克水里。拧“干”后,衣服上还有1千克水,所以污物残存量是原来的1/21 。 方案2、3——二次漂洗 若把20千克水分两次用,比如第一次用5千克,第二次用15千克,同理可得污物残存量是原来的1/96。 方案4——二次漂洗 再比如第一次用10千克水,第二次用10千克水,污物残存量则是原来的1/121
方案A——全面实施方案 方案B——逐个因素寻找法 常见试验方案设计 优点:是一定可以找到所有搭配中最优的方案。 缺点:试验次数过多。特别是在因素数目较多、水平取的较多的情况下,即使想这样做可能也办不到。 方案B——逐个因素寻找法 这个方案的优点是减少了试验次数。不过,这种方法的缺点也是显而易见的。 不一定能找到最优的组合。
一次一因素法 变动一个因素, 固定其他因素的方法。这种方法常因因素之间存在交互作用, 而水平又未固定的适宜搭配关系, 致使试验需反复多次, 试验周期长。
考查因素较多的科学实验 浮 选 试 验 因素 磨矿细度 捕收剂用量 抑制剂用量 浮选浓度 浮选时间 浮选温度 活化剂用量 调整剂用量 搅拌强度 搅拌浓度 搅拌时间
这些自变量X取什么值时将会使Y达到最佳值? 试验 试验是一个或一系列有目的地改变流程或系统的输入变量以观察识别输出应变量随之改变的实验。 Douglas C. Montgomery 记住6 Sigma的焦点是确定流程方程式: Y = f(X) 这个方程式只有通过试验设计才能得到. 有时现有数据能给黑带或绿带指明改进方向. 不过通常现有数据的变化范围不足以宽到所需的整个试验空间. 多数流程需把输入变量设置在正常的操作限度以外以帮助确定由此可能引起的流程偏差. Y=f(x) 那些自变量X显著的影响着Y? 这些自变量X取什么值时将会使Y达到最佳值? Pg 23
你有哪些输入变量呢 ? 流程 流程或系统的一般模型 ? 噪音输入变量 (离散) 关键流程 可控输入变量 输出指标 噪音输入变量 (连续) 输入变量各式各样. 其大小可以按要求设定在指定数值的的那类输入变量称为“固定效果”模型. 另一些从包含所有变化范围的总体中提取一部分作为样本进行研究的输入变量 (例如, 从50批触媒中拿出5批作分析) 称为 “随机效果”模型. 本节及随后章节主要涉及“固定效果”模型. “随机效果”模型将在随后的培训中介绍. 本节开头介绍的教科书也可用于参考. 应用范围:固定效果模型, 固定效果模型与随机效果模型与抽样方略有一定的关系: 固定效果模型基于以母体为基础的抽样: 1)母体完全已知 2)要素可以清楚的确认 3)纯随机选择的可能性 4)可预测的随机概率 随机效果模型基于以流程为基础的抽样: 母体部分已知 2)不可能纯随机的选择 3)随机概率不可预测 从母体到流程抽样的方法: 母体 ---------------------------------------------------------------------- 流程 纯随机抽样 分层随机抽样 系统抽样 样本子集 (适用于小批量流程) (大规模生产以合理分组为基础) 抽样要考虑: 典型性:抽样应该具有代表性 独立性:样本之间应该不相关 经济性:确定样本大小需要考虑经济性 但是要得到一定的结果,同样要考虑统计学上的最小样本容量: 工具与统计量 最小样本容量 平均 5-10 标准偏差 25-30 缺陷率 100 柱状图或柏拉图 50 散点图 25 控制图 20 可控输入变量 流程 关键流程 输出指标 噪音输入变量 (连续) ? 你有哪些输入变量呢 ? Pg 24
找出定义流程的公式 (y=f(x)) 以优化流程 试验的目的 确定 那些输入对输出影响最大(确定关键输入变量) 什么样的输入设置能产生理想的输出结果 怎样设置影响最大的输入水平以减少输出变量的变化范围 怎样设置可控输入水平使得不能控制的输入变量对输出的影响减到最小 找出定义流程的公式 (y=f(x)) 以优化流程 进行试验设计的目的应与6 Sigma 项目的目标紧密结合. Pg 25
试验设计中的基本术语 因子 (可控因子, 非可控因子) X 水平: 为了研究因子对响应的影响,需要用到因子的两个或更多的不同的取值, 这些取值称为因子的水平(level)或设置(Setting). 处理或试验: 按照设定因子水平的组合,我们就能进行一次试验,可以获得一次响应变量的观测值,也可以称为一次“试验”(trial, experimental run),也称为“一次运行”(run). 试验单元(experiment unit):对象,材料或制品等载体,处理(试验)应用其上的最小单位 试验环境:以已知或未知的方式影响试验结果的周围环境 模型:可控因子(X1, X2, … Xn), 响应变量(Y) , f 某个确定的函数关系 Y= f ( X1, X2, X3,….. Xk) + Error (误差) 主效应: 某因子处于不同水平时响应变量的差异 交互效应: 如果因子A的效应依赖于因子B所处的水平时,我们称A与B之间有交互作用. OFAT法(One-Factor-At-a-Time):在各因子的变化范围每次改变一个因子的水平以选定各因子的最佳水平。 Pg 26
试验设计的基本原则 重复试验(replication) 一个处理施加于多个试验单元。我们一定要进行不同单元的重复(replicate),而不能仅进行同单元的重复(repetition):要重做试验,而不能仅重复观测或重复取样。 随机化(randomization):用完全随机的方式安排各次试验的顺序和/或所用的试验单元。防止那些试验者未知的但可能会对响应变量产生的某种系统的影响。 划分区组(blocking):按照某种方式把各个试验单元区分成组,每组内保证差异较小,使他们具有同质齐性(homogeneous),则我们可以在很大程度上消除由于较大试验误差所带来的分析上的不利影响。如果分区组有效,则这种方法在分析时,可以将区组内与区组间的差异分离出来,这样就能大大减少可能存在的未知变量的系统影响。 能划分区组者则划分区组,不能划分区组者则随机化。 Block what you can and randomize what you cannot
我们如何试探输入变量? 设想打高尔夫球是一个试验 打一轮高尔夫球的输出变量是什么? 可控制的输入变量是什么? 不可控制的输入变量是什么? ? 分数, 越低越好 (击球及推杆数少) 可控制的输入变量是什么? 球及球杆的类型 带着球杆步行或开车运送 玩球时喝掉的啤酒瓶数 不可控制的输入变量是什么? 击球的前后一致性 天气 – 风, 雨, 太阳, 温度 多数高尔夫球选手会不断练习其球技. 如果他发现今天击球偏向一边, 他会调整右手位置以减少或消除偏斜. 如果击出的球太高或太低, 他会向前或向后调整站立位置以补偿. 我们如何试探输入变量? ? Pg 28
“最佳猜测”法 工业界最常用 程序 选择 “最佳估计” 的因子组合 进行一次试验 (打一轮) Ping 牌球杆, Titleist 牌球, 开车, 四瓶啤酒 进行一次试验 (打一轮) 输出结果与预期值比较 (分数: 94 – 不太好) 如结果不理想, 将其中一个因子的水平改变 – 重新试验 如需要重复试验 缺点 如第一次估计错误, 需要更多次试验– 低效率且时间长 如第一次估计可以接受, 试验会停止下来, “最佳”方案可能永远找不到 工程师和科学家常采取这种策略,因为试验者对他们研究的系统有大量技术上的或理论上的专业知识. 有时可接受的结果在一二次估计后就可以达到, 看起来很有效. 另一些时候经过多次试验仍不能保证得到可行方案. 精神病学者曾证实中期强化训练对长期习惯有很强的作用. 换句话说, 奉行“最佳估计”的人有时最难接受统计学试验设计的益处, 因为他们的方法有时实际上更快及更有效得到结果. Pg 29
我们应把各因子的水平设定在哪里呢? OFAT法– 每次一个因子(One-Factor-At-a-Time) ? 常用于对所研究流程了解有限的情况 程序 选择一个因子水平的组合作基线 在各因子的变化范围每次改变一个因子的水平 选定各因子的最佳水平 对啤酒及走或开车的组合: 多数高球手用这种方法(或称为最佳估计法)进行试验. 要提高击球水平, 先改变握杆方法. 如果还不行, 改变站位. 若还是不行,减慢挥杆速度. 如真正的问题是各因素的组合, 我们永远不会找到答案. 由图表所知,该高球手应少喝啤酒且开车进行练习. ? 我们应把各因子的水平设定在哪里呢? Pg 30
OFAT的缺点 主要缺点 OFAT 未能考虑交互作用 另一个缺点 交互作用 – 在另一个因子的不同水平, 一个因子产生的效果不相同 学试验设计效率差 本例中, 用OFAT策略,该高球手不会观察到这个交互作用. 他会用错误的方法得出错误的结论. 按照上页的图表, 他应该少喝酒且花钱租车. 本页的图表则表明他可有所选择– 如开车就可喝酒, 如少喝酒在球场行走做练习也可以. Pg 31
DOE 是6 Sigma 的实验方法! 解决方案-因子试验设计 处理多个因子的正确方法是进行因子 试验 因子试验 即Factorial experiment design 因子试验 各因子一起改变其水平而不是一次一个 试验设计是进行一整套试验且所有试验完成后才进行分析 DOE指一个学习领域的标题,如 “我正在上DOE课程.” 试验本身实际是SDE – 按统计学设计的试验(Statistically Designed Experiments). 不过, 把DOE等同于统计学设计的试验很平常, 如, “我已完成 DOE的第一个试验.” DOE 是6 Sigma 的实验方法! Pg 32
可以有更多的因子吗? 因子试验 – 实例 考虑高球例子的两个因子: 啤酒和开车 考虑高球例子的两个因子: 啤酒和开车 一个因子试验会设置如下: 各因子在另一个因子的各水平改变其水平 如加上第三个因子, 球的类型 (Titleist 或Pinnacle), 设计会变成: DOE常有三个以上的因子. 但很难用图展示试验设计. 车 啤酒 w r 4 球 T P 车 啤酒 w r 4 ? 可以有更多的因子吗? Pg 33