MINITAB Minitab 培训 Minitab Training
培训目标 学会Minitab的软件常用操作 逐步体会在实际工作中应用Minitab 深入掌握各功能模块 Minitab 培训 Minitab Training
培训知识体系 软件操作 Minitab Minitab 培训 Minitab Training 统计理论 质量管理
课程安排 基础应用篇(结构功能、描述性统计、图表制作……) 统计分析篇(假设检验、相关与回归分析……….) 质量工具篇(SPC、MSA、DOE………) Minitab 培训 Minitab Training
第一部分 基础应用篇 Basic application Minitab 培训 Minitab Training
第一部分 本节我们将学到: Minitab使用结构、使用技巧 描述性统计原理、方法 常见统计公式回顾 常见图表制作及分析 Minitab 培训 Minitab Training
Minitab 特点 数据处理,快速便捷 图形处理,直观形象 问题解决,深入全面 Minitab 培训 Minitab Training
视窗结构 工作表窗口 图形窗口 会话窗口 项目管理窗口
文件类型 对工作表 对图形 对项目
数据类型 “D” 表示日期/时间 “T” 表示 文本’ 表示‘数值’ 数据方向 列名 数据输入区域
常用菜单与命令 Minitab软件提供强大的Help 文件,在该文件里,我们可以 找到和质量相关的所有名词解 释和统计相关的所有公式以及 大量的案例,让我们更深入的 掌握统计知识,了解质量内容
操作便捷高效 可以根据需要把常用的 工具放在菜单栏中
菜单指令 在会话窗口显示结果 输出结果保存在表中 输入分类变量
计算结果 思考: 输出的属性信息(N、N*、均值标准误、四分位数等表示什么意思?有什么作用?是怎么计算而来的?) Minitab 培训 Minitab Training 思考: 输出的属性信息(N、N*、均值标准误、四分位数等表示什么意思?有什么作用?是怎么计算而来的?)
图形显示 注:Minitab输出的图形,可以直接复制+粘贴到word、pownpoint等软件。方便做报告时使用
数据与图形的对应 绿色 = 图形与数据同步 (图形化汇总) 黄色 = 数据发生改变,图形有待更新(图形) 绿色 = 图形与数据同步 (图形化汇总) 黄色 = 数据发生改变,图形有待更新(图形) 白色 = 不能更新 (布局图, 或者包括统计结果) (图形化汇总)
图形编辑 步骤: 1、单击选中所有条形 2、再单击选中想要编辑的条形 3、双击该条形,出现编辑对话框(如中图)
常用图表制作 箱线图 直方图 散点图 时间序列图 这些图形的作用分别是什么呢?
箱线图 图形→箱线图 异常值 Max Q3 Q2 Min Q1
点图 图形→点图 点图常用于质量 分析中的分层!
怎么样来编辑图形呢?能在图形上添加参考线吗 直方图 图形→直方图 直方图作用: 常用于定性判断样本分布情况(正态分布) 怎么样来编辑图形呢?能在图形上添加参考线吗
直方图 Minitab 培训 Minitab Training
直方图
散点图 图形→散点图
散点图 (分组)
散点图 (分割面板) 散点图用来判断两个变量之 间的相关关系(一次关系、 二次关系等,此图常常用 于回归分析)
时间序列图 时间序列图用于考察样本数据随时间变化而呈现的趋势
练习I 您想要评估四个供应商提供原材料产品的耐用性。根据四个供应商提供的原材料生产的产品中测量 60 天后的耐用性。请用相关的图形进行判断和分析。 Data/供应商.MTW
练习II 公司关心相机电池的新配方是否能够很好地满足顾客的需要。市场调查显示,如果两次放电之间等待的时间超过 5.25 秒,顾客就会变得很不耐烦。 您收集了使用过不同时间的(新旧配方)电池的样本。然后,您在每个电池放电后立即测量了其剩余电压(放电后电压),而且还测量了电池能够再次放电所需的时间(放电恢复时间)。请创建一个按配方分组的合适图形来检查结果。在 5.25 秒的临界放电恢复时间处包括一条参考线。
练习III 您的公司采用两种不同的过程来生产塑料小球。能源是一项主要成本,您想尝试一种新的能源来源。您在前半个月使用 A 来源(原有来源),而在后半个月使用 B 来源(新来源)。请创建一个合适的图标,用以说明两个来源下两种过程的能源成本。 Data/能源成本.MTW
第二部分 统计分析篇 Statistics Analysis Minitab 培训 Minitab Training
统计分析篇之 假设检验 Hypothesis
假设检验 本节我们将学到: 1、假设检验概念、原理 2、假设检验原则、步骤 3、两类错误(弃真、纳伪) 4、P值、置信区间 5、单样本Z检验 6、单样本T检验 7、双样本T检验 8、功效和样本数量的确定
统计方法结构 统计方法 描述统计 推断统计 假设检验 我们在什么时候会用到参数估计? 参数估计
为何用假设 业务问题: • 某炼钢炉改变原操作方法以提高钢的收得率,现用二种方法各炼10炉,如何从10组数据来比较钢的收得率有显著提高? • 客户要求交货期为30天,现从运作中收集实际交货期数据, 问:实际交货期是否符合客户要求? 我认为该企业员工的平均年龄为50岁!
假设检验 业务问题 统计问题 统计解决方案 业务解决方案
假设检验 上述问题都可以看成对总体或总体参数的某个假设,然后利用从总体中抽取的样本来判断假设的真伪。这就是假设检验问题。 请将上述业务问题转化成统计问题 第一个业务问题实际上是检验二个总体的均值是否相等,即μ1 = μ 2; 第二个问题实际上是检验交货期的均值是否小于等于30,即μ ≤30。
什么是假设检验 1. 概念 事先对总体参数或分布形式作出某种假设 然后利用样本信息来判断原假设是否成立 2. 类型 参数假设检验 1. 概念 事先对总体参数或分布形式作出某种假设 然后利用样本信息来判断原假设是否成立 2. 类型 参数假设检验 非参数假设检验 3. 特点 采用逻辑上的反证法 依据统计上的小概率原理 Minitab 培训 Minitab Training
假设检验的总体过程 总体假设 抽取样本 统计运算 检验决策
假设检验的基本思想 m m = 50 抽样分布 ... 因此我们拒绝假设 = 20 ... 如果这是总体的真实均值 20 这个值不像我们应该得到的样本均值 ... 20 ... 因此我们拒绝假设 = 20 m ... 如果这是总体的真实均值 m = 50 样本均值
假设检验原则 等号放在原假设 原假设(Ho)和备择假设( H1)完备且互斥 备择假设称为研究假设,把变化后的问题放在备择假设中
双侧检验 检验企业生产的零件平均长度是否为4厘米 从统计角度陈述问题 (U = 4) 从统计角度提出相反的问题 (U ≠4) 必需互斥和穷尽 有 ≠符号
单侧检验 建立的原假设与备择假设应为 H0: U = 1500 H1: U ≠ 1500 采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上 建立的原假设与备择假设应为 H0: U = 1500 H1: U ≠ 1500
双侧检验与单侧检验 m = m0 m m0 m m0 m ≠m0 m < m0 m > m0 假设 研究的问题 双侧检验 左侧检验 右侧检验 H0 m = m0 m m0 m m0 H1 m ≠m0 m < m0 m > m0 9
假设检验中的两类错误 1. 第一类错误(弃真错误) 原假设为真时拒绝原假设 第一类错误的概率为(Alpha) 被称为显著性水平 1. 第一类错误(弃真错误) 原假设为真时拒绝原假设 第一类错误的概率为(Alpha) 被称为显著性水平 2. 第二类错误(取伪错误) 原假设为假时接受原假设 第二类错误的概率为β(Beta) 1- β 被称为检验功效
两种错误的关系 和的关系就像翘翘板,小就大, 大就小 你不能同时减少两类错误!
假设检验的步骤 提出原假设和备择假设 确定适当的检验统计量 规定显著性水平 计算检验统计量的值 作出统计决策
显著性水平与拒绝域 抽样分布 H0值 临界值 a/2 样本统计量 拒绝域 接受域 1 - 置信水平
显著性水平与拒绝域 抽样分布 置信水平 拒绝域 1 - a 接受域 H0值 样本统计量 临界值
什么是 P 值 是一个概率值 是观测到的原假设为真时的概率 左侧检验时,P值为曲线上方小于等于检验统计量部分的面积 被称为观察到的(或实测的)显著性水平 H0能被拒绝的最小值
利用 P 值进行决策 单、双侧检验 若p值> α,不能拒绝 H0 若p值< α, 拒绝 H0
双侧检验 1/2 1/2 拒绝 拒绝 1/2 p值 1/2 p值 H0值 样本统计量 实际值 实际值
单侧检验 拒绝 p值 H0值 样本统计量 实际值
案例解析 STATEWIDE公司主要从事机床部件生产,从流程中抽样 36件,得到这些部件的长度资料, 已知部件长度标准差为 8.2mm。试在置信水平为95%的要求下,请确定这一批 部件的平均长度是否为42mm。 Data/单样本Z检验.mtw
单样本 Z 检验 之一 统计→基本统计量→单样本Z
单样本 Z 检验 之二
单样本 Z 检验 之三 如果标准差未知,改怎么选择检验方法?
单样本T检验 我们知道某种类型硬盘的平均传送时间是0.545微秒,这是一个关键的质量参数(越小越好) 。一个新的替代品被提出来(便宜一些) 。替代的设计比原有设计更好吗? data/单样本T.mtw
单样本T 何时使用单样本T 什么是单样本T 当样本是从连续型总体数据中随机抽取的数据时使用单样本T 要求数据要服从正态分布,但通常对此要求不是很严格,只要数据是非单峰的连续型数据数据即可 单样本T检验用来判断样本均值是否和假设均值相等。(用于标准差未知的情况)。 单样本T检验用样本标准差来估计总体标准差,通常需要样本服从正态分布。
双样本T检验 为试验某种促销手段对产品销售的效果,选出20个环境大 致相同的城市。其中10个实施该促销手段。另10个不实施 该促销手段,得到销售额 (单位:万元)资料, 假设销 售额都服从正态分布,且方差相等。试确定促销手段是否 有效。 Data/双样本t检验.mtw
双样本 t 检验 之一 统计→基本统计量→双样本t
双样本 t 检验 之二
双样本 t 检验 之三 如果我们把原假设和备择假设互换, 会出现什么样的情况?
功效和样本量 某钢铁公司项目团队在参数调整后,希望评估冷拉钢筋生产线上的钢筋平均抗拉强度是否能从2000Kg有所提高,假定生产线的制成的标准差为300Kg,经检验,钢筋平均抗拉强度已变为2150Kg。问:若在95%的置信水平下,检验功效为90%,项目团队对于“钢筋生产线上的平均抗拉强度是否从2000Kg有所提高的检验,需要抽取多少根钢筋才能同时达到这两类风险的要求?”
检验力与样本大小 之一 统计→功效和样本数量
检验力与样本大小之二
检验力与样本大小 之三
练习 某轧钢厂为提高某管坯的屈服强度,改变轧制工艺的某些参数作试验,从取得的部分数据分析知:均值为Xbar=39.32,标准差为S=0.75,屈服强度服从正态分布,且目标值为40,希望探测到的差异d = 0.68,若要作T检验分析其改变工艺是否有效,试确定样本容量。(取α =0.05 ,β =0.2)
练习
练习I 在某部件加工生产中,其厚度在正常生产下服从N(0.13,0.015*0.015),某日在生产的产品中抽查了10次,其观测值为:0.112,0.130,0.129,0.152,0.138,0.118,0.151,0.128,0.158,0.142.但发现其平均厚度已增大至0.136,若标准差不变,试问生产是否正常?(置信水平95%)
练习II 一种机床加工的零件尺寸绝对平均误差允许值为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? Data/one sample T.MTW
统计分析篇之 相关与回归 Regression
回归分析 本节我们将学到: 1、相关与回归、回归基本形式 2、相关系数 3、最小二乘法 4、模型判断、回归方程显著性判断 5、残差分析、残差判断 6、逐步回归 7、最佳子集回
回归的基本概念 客观事物的联系 确定性关系 非确定性关系 (函数关系) (相关关系) 根据变量间客观存在的相关关系,建立起合适的数学模型,分析和讨论其性质和应用的统计方法,称为回归(Regression)。
回归场景 行政 某软件公司想知道电话排队与服务时间之间的关系。 制造 客户与供应商就客户收到的数量与给定提前期的几个月订货数量不一致。 设计 某化学工程师,设计了一个新的流程,想要调查关键输入因子与氨的堆叠损失之间的关系。
有效的数理统计工具 社会经济 金融财务 工艺质量 市场营销 确认X和Y之间的关系; 找到少数关键的X; 通过设置X,控制和优化Y;
常见的回归形式 离散X因子 多元线性) 多元非线性 简单线性回归 一元非线性 离散响应变量的逻辑回归 % yes Xi Y X2 X1 X Xa Xb Xc 多元线性) X2 X1 多元非线性 简单线性回归 X 一元非线性 离散响应变量的逻辑回归 1 % yes
回归分析的一般过程 明确研究的对象和范围 变量的基础分析 观察散点图 作描述性统计 线性或曲面? 一元或多元? 数据转换? 离散型 X,离散型Y? 计算参数 Residual? R-Sq? B0、 bi、 b2 ? 通过 收集并了解数据 选择回归模型 (假设) 模型求解 模型检验 实际应用 控制输出值 通过输入值预测 未通过 变量的基础分析 明确研究的对象和范围
散点图 散点图能显示出自变量X跟响应变量Y的关系。 散点图显示输入(x)跟输出(Y)的变化关系。 X (input) Y (output) 散点图显示输入(x)跟输出(Y)的变化关系。 当这些点随机的分布的时候,表示输入与输出之间没有什么关系。 Y Variable Wird auf der vertikalen Achse abgebildet. Ist es eine Outputvariable (Ein Messwert, der den Kunden interessiert oder ein Messwert der Prozessleistung).
相关系数 (r) 相关系数, r: 变化范围是: -1 到1 r = – 1绝对负相关 r = 0 无线性关系 r = + 1绝对正相关
散点图与相关系数 强的正相关性 r = .95 适度正相关 r = .70 强的负相关r = -.90 适度负相关 r = -.73 Y Y Y X X X 强的正相关性 r = .95 适度正相关 r = .70 无相关性 r = .006 Y Y Y Note: If slope b1 = 0, then r = 0. Otherwise there is no correlation between slope b1 and correlation r. X X X 强的负相关r = -.90 适度负相关 r = -.73 其它模式 无线性关系 r = -.29
回归模型 e 2 Y X 1 3 4 a b i 残差怎么样是情况才表明我们拟合的好?
Min( ) 最小二乘法 e = 观测 Y – 估计 Y e e e e e a & b 2 2 2 2 2 i 1 2 3 4 i 1 a & b
理论公式 Yi = a + bxi 回归方程 回归斜率 回归截距 Regression line: Find the line where the vertical distance to each data point is as small as possible – these distances are called residuals. Regression analysis uses the least squares method to determine this “best line”: Least squares method Measure vertical distance from points to line Square results Sum the total squared distance Find the line that minimizes that sum Data (both X and Y values) are used to obtain bo and b1 values establish the equation Minitab will do this for us! A note on terminology: These terms are often used interchangeably: Regression equation* Regression line Prediction equation Prediction line Fitted line or fits* Model *Minitab’s term 回归截距
范例讲解 假如你是玩具熊公司的市场分析员,现已得到下列数据: Ad $ Sales (Units) 1 1 2 1 3 2 4 2 5 4 请问广告费用与销售额之间有关联吗?
散点图 Sales 4 3 2 1 1 2 3 4 5 Advertising
计算表 __ __ _ _ X Y X--X Y--Y (X—X) (Y—Y) i i i i i i 1 1 -2 -1 2 2 1 -1 -1 1 3 2 4 2 1 5 4 2 2 4
计算 Y = -0.1 + 0.7x
模型的评估 1. 变差测量 可决系数 (R2) 标准误差 (Se) 2. 残差分析 3. 显著性检验 Y a b i X i
变差图示 未被解释的离差平方和 (Yi -Yi) Y Yi ^ Yi 总离差平方和 (Yi - Y) __ Y a + b X i i Y X X i
可决系数 可决系数表示:由回归方程解释的总变异的比例 回归方程解释的变异 SSR R 2 0 R2 1 ˆ 总变异 SST
标准误差
残差分析(误差项随机) 假定 工具 解决思路 1. 残差与 X 线性无关 残差 vs. X 如果X和Y的关系不是直线,而是曲线。对X或者Y或者两者做个转换,或者加入2次项。 2.查看相邻误差项之间是否存在任何相关性 残差 vs. 观测顺序 任何可视的模式意味着另一个跟时间相关的因子影响着Y。发现这个因子,并包括进回归模型。 3. 恒方差 尝试做开放, log, 或者 Y的逆转换. 残差vs预测 Y 拟合值) 4. 残差项服从正态分布,期望为零,方差为常量 残差非正态分布. 尝试对X或者Y,或者两者做转换。 正态概率图 & 残差直方图
实例演练 Data/一元线性回归.mtw 下表为某工程师提供的数据.表明某特种钢的韧性与冶炼时间的记录: 序号 时间(Min) 韧性(HRB) 1 2 3 4 5 6 7 8 116.5 120.8 124.4 125.5 131.7 136.2 138.7 140.2 255.7 263.3 275.4 278.3 296.7 309.3 315.8 318.8 9 10 11 12 13 14 15 16 146.8 149.6 153 158.2 163.2 170.5 178.2 185.9 330.2 340.2 350.7 367.3 381.3 406.5 430.8 451.5 Data/一元线性回归.mtw
一元线性回归 之二 P表示什么含义?
拟合线图 之一 拟合线图可以通过图形体现一元函数关系
实例演练 研究者想预测上班族的年收入,他收集了15位上班族的年收入(万元)、IQ、EQ和创造力,试用这些变量联合预测年收入。 Data/多元线性回归.mtw
多元线性回归 之二
逐步回归 之二
最佳子集回归 对于以实际问题,通常并不能得到一个公认的“最好的”回归方程,采用逐步回归的方法也会有不同的结论。为了不漏掉任何一种可能的好结果,我们使用最佳自己的回归方法,把所有可能的自变量的子集进行回归之后全部列举出来,以便研究者能综合考虑,从中选一个最满意的结果
最佳子集回归 之二
实例演练 已知某感应器的感应距离和4中元器件X1、X2、X3、X4可能有关,记录13组数据,试分析这些元器件与该感应器之间的关系 Data/多元线性回归II.mtw
常见质量工具图 本节我将学到: 柏拉图 因果图 多变量图
Pareto:找出少数重要、和多数琐碎的缺陷, 柏拉图 之二 Pareto:找出少数重要、和多数琐碎的缺陷, 常用的原则是80/20原则
因果图 之三 人、机、料、法、环、测 使用因果 (鱼骨)图组织有关问题的潜在原因的集 体讨论信息。图表帮助您了解潜在原因之间的关系。
统计过程控制 本节我们将学到: 1、统计过程控制原理 2、中心极限定理 3、常用控制图的选择、阶段 4、八项判异原则 5、连续型数据控制图(Xbar-R、Xbar-S、I-MR) 6、离散型数据控制图(P、NP、C、U) 7、两类错误
过程受控的判别 准则 #1:1点落在A区之外。 UCL LCL Zone A = +3 Zone B = +2 Zone C = +1
过程受控的判别 准则 #3:连续6点递增或递减。 UCL LCL Zone A = +3 Zone B = +2 Zone C = +1 Zone A = -3 Zone B = -2 Zone C = -1
过程受控的判别 准则 #4:连续14点相邻点上下交替。 UCL LCL Zone A = +3 Zone B = +2 Zone C = +1 Zone C = -1 Zone B = -2 Zone A = -3 LCL
过程受控的判别 准则 #5:连续3点中有2点落在中心线同一侧的B区之外。 UCL LCL Zone A = +3 Zone B = +2 Zone C = +1 Zone A = -3 Zone B = -2 Zone C = -1
过程受控的判别 准则 #6:连续5点中有4点落在中心线同一侧的C区之外。 UCL LCL Zone A = +3 Zone B = +2 Zone C = +1 Zone A = -3 Zone B = -2 Zone C = -1
过程受控的判别 准则#7:连续15点落在C区之内。 UCL LCL Zone A = +3 Zone B = +2 Zone C = +1 Zone C = -1 Zone B = -2 Zone A = -3 LCL
准则#8:连续8点落在中心线两侧,但无1点在C区之内。 过程受控的判别 准则#8:连续8点落在中心线两侧,但无1点在C区之内。 UCL Zone A = +3 Zone B = +2 Zone C = +1 Zone C = -1 Zone B = -2 Zone A = -3 LCL
合理子组原则 在抽取样本时,要使组内波动仅由正常原因引起的,而组间波动由异常波动引起的
合理取样(时间) 以子组为单元收集数据: 子组大小:4—5个为宜 子组个数:20—25个最佳 抽样间隔: 若每小时生产10个以下产品,间隔可为8小时 若每小时生产10—20个产品,间隔可为4小时 若每小时生产20—49个产品,间隔可为2小时 若每小时生产50以上产品, 间隔可为1小时
实例演练 问题: 数据 Xbar-R.mtw 设某事物包装重量是一重要特性,为对其进行控制,在生产现场每隔一小时连续抽样5个样本产品重量,请用相关控制图分析过程是否受控。 验证中心极限定理 练习数据的堆叠、拆分 工具: 数据收集: 该项目小组每小时随机收集5个样本,称其重量(数据有效) Xbar-R chart 连续型数据 子组大小是5
均值-极差图 之一 ⑴.计算过程均值 与平均值极差 ⑵.计算Xbar-R中心线与控制限 Xbar图:CL=50.34 ⑴.计算过程均值 与平均值极差 ⑵.计算Xbar-R中心线与控制限 Xbar图:CL=50.34 — UCLXbar= +A2R=50.34+0.58×9.16=55.65 — LCLxbar= -A2R=50.34--0.58×9.16=45.03 R图:CLR=9.16 — UCLR=D4R=2.11×9.16=19.33 — LCLR=D3R=*×9.16=0
均值-极差图 之二 对于这张输出图形,我们该怎么分析? 图形中每个点表示什么意思? 先分析哪张图形再分析哪张图?为什么? 红色数据点表示什么?该怎么处理?
R chart 什么是R图? 为什么使用R图? 子组内波动是否显著? 数据在意较短时间内波动情况? 例如,R chart可以考察: 胶器由于间歇性堵塞导致提供的胶水不一致,这时胶板的变异会增加 由于一松散的夹具,钻孔的位置产生较大的变异 何时使用R图? 使用R图来比较流程中子组内波动情况 数据是按子组收集,且不能判断子组内是有波动 AIAG建议子组大小小于8
A2、D3、D4常数表 n 2 3 4 5 6 7 8 9 10 A2 1.88 1.02 0.73 0.58 0.48 0.42 0.37 0.34 0.31 D3 * 0.08 0.14 0.18 0.22 D4 3.27 2.55 2.28 2.11 2.00 1.92 1.86 1.82 1.78 注:在控制图中,通常用Rbar/d2来估计子组间标准差的计算,如果你希望在软件中变换过来,可以通过“X-bar选项”中的估计来设置,也可以通过工具—选项—控制图和质量工具—估计标准差来更改默认设置
某注塑产品的关键尺寸CTQ进行控制,每隔一小时测量 10个尺寸,如表xbar-s.mtw,试做Xbar-s控制图进行分析 均值—标准差控制图 某注塑产品的关键尺寸CTQ进行控制,每隔一小时测量 10个尺寸,如表xbar-s.mtw,试做Xbar-s控制图进行分析 Xbar-S图的制作与分析方法与Xbar-R图一致,请参与Xbar-R图分析 比较分析:Xbar-R图和Xbar-S图哪个对流程的控制判断 更为精确?为什么?
均值—标准差控制图 1、计算过程均值和标准差 2、计算Xbar-S图上的上下控制线 Xbar 图:UCLx =X+A3S=81.5542+0.98×0.873315=82.41 LCLx =X-A3S=81.5542-0.98×0.873315=80.698 S图: UCLs=B4S=1.72×0.873315=1.502 LCLs=B3S=0.28×0.873315=0.245
控制图 统计→控制图→子组变量控制图→Xbar-S →
附录:A3,B3,B4表 N 2 3 4 5 6 7 8 9 10 B4 3.27 2.57 2.27 2.09 1.97 1.88 1.82 1.76 1.72 B3 * 0.10 0.12 0.19 0.24 0.28 A3 2.66 1.95 1.63 1.43 1.29 1.18 1.10 1.03 0.98
计数型数据控制图 控制图 控制线计算 分布 n ) p - (1 3 ± c U 控制图 u P 控制图 二项分布 NP控制 图 C控制图 波松分布 U 控制图 u
实例演练 在二极管生产线上,与每个班次结束前抽取数量不等的二极管进行检验,下面是12月份共计30个工作日每天不合格二极管数量的记录,绘制一控制图分析产品的不合格率是否受控
P 图 之二
C Chart 统计→控制图→属性控制图→C
练习I 您在汽车发动机组装厂工作。部件之一的凸轮轴的长度必须为 600 毫米 +2 毫米以满足工程规格。凸轮轴长度不符合规格是一个长期以来的问题,它引起装配时配合不良,导致废品率和返工率都居高不下。您的主管要绘制 X 和 R 控制图以监控此特征,于是您在一个月中从工厂使用的所有凸轮轴收集共 100 个观测值(20 个样本,每个样本中 5 个凸轮轴),并从每个供应商处收集 100 个观测值。首先您将看到供应商 2 生产的凸轮轴。 Data/凸轮轴.MTW
过程能力分析 Capability Analysis 质量工具篇之 过程能力分析 Capability Analysis
过程能力分析 本节我们将学到: 1、Cp、CPk计算及关系 2、PP、PPk计算及关系 3、西格玛水平计算 4、正态检验与判别 5、非正态数据能力分析步骤与方法 6、离散型数据能力分析
什么是过程能力分析 什么是能力分析? 能力分析是用来评估流程满足规格要求的情况。流程能力分析包括: 1、用控制图来判断流程是否处于受控状态 2、判断流程输出的分布情况 3、用Cp、Cpk、Pp、PPk或西格玛水平来评估长期流程能力和短期流程能力 4、在做能力分析后应明白影响流程的因素有哪些?该怎么改进流程 5、在当前流程下,PPM是多少?
过程能力CP与CPK 在我们做能力分析之前,请确信: 1、流程处于受控状态 2、可以找到相关的分布来拟合数据
Cp与CPK 对流程生产数符合要求的产品、服务的能力的测量 CP—短期流程能力 中心和均值重合 看作是流程的最佳值 在一段有限时间内 在一段有限的时间内 中心和均值重合 看作是流程的最佳值 CPK—短期流程能力指标 在一段有限时间内 考虑中心与均值是否重合 流程实际能力
Pp与Ppk Pp:也称过程绩效指数,是从过程总波动的角度考察过程输出满足客户要求的能力(也成长期过程能力指数) PP、Ppk的算法与Cp、Cpk的算法类似,只是标准差不一样,过程总波动标准差长用S来估计
计算公式
实例演示 一家汽车轴承生产公司为调查某种轴承的控制水平,每隔30分钟测试10个数据值,结果如下页所示。已知轴承值的规范要求在12±1(mm)之间,试分析其过程能力如何。 Data/过程能力分析2.MTW
实例演练 统计→质量工具→能力分析→正态
实例演练
过程能力等级划分(参考) 警告:这不是可以适用于任何流程的标准 等级 Cp值 对策 特级 1.67≤ Cp 过程能力过高,放宽检查 一级 过程能力充足,保证过程控制 二级 1.00≤Cp<1.33 过程能力尚可,加强过程控制与检验 三级 0.67≤Cp<1.00 过程能力不足,采取过程改进措施 四级 Cp<0.67 过程能力过低,立即停产对过程全面改进 警告:这不是可以适用于任何流程的标准
六西格玛水平的过程能力 Cp ≥ 2.0 Cpk ≥ 1.5 Process Z ≥ 4.5(长期)
实例演练 案例背景: 一家调查公司为调查某种汽车尾气PH值的控制水平,每隔5分钟测试一次其PH值(10个),结果如下页所示。已知PH值的规范要求在3.98与4.02之间,试分析其过程能力如何。
原始数据 PH 4.008 4.011 4.000 3.996 4.007 4.002 3.997 4.005 3.986 4.009 3.999 4.003 4.010 3.995 4.001 3.994 3.992 3.988 4.006 3.998 4.004 4.018 3.987 4.013
过程能力分析 之一 统计→质量工具→能力分析→正态
非正态数据的能力分析
实例演练 案例背景: 某公司生产半导体陶制品,经理欲通过能力分析来考察流程满足客户要求的情况,改陶制品的中心处有一空心圆,通过公差设计要求圆心距边的距离不能超过30微米 使用工具: Normal Test 正态检验 Capability Sixpack---Normal 六合一能力分析 Individual Distribution Identification 个体分布标识 Johnson Transformation Johnson转换
实例演练 统计→基本统计量→图形化汇总 P值小于0.05,此数据非正态
非正态流程能力分析 Cpk=0.62 Ppk=0.62
流程能力分析 Cpk=0.61 Ppk=0.61
离散型数据能力分析 前面讲的均为连续性数据能力分析,那么,对立离散型数据,我们应怎么样才对其进行能力分析呢?
案例 某公司在生产一零件过程中,一个月共生产2500个该零 件,已知每个零件有10处能产生缺陷,在对产品检验过程 中,共发现8个缺陷,试计算DPMO和西格玛水平
根据DPMO的值,查找标准正态分布表,找到Z,即为西水平格玛 百万机会之缺陷数 D:缺陷数 O:单位缺陷机会 U:单位数 DPMO=【D/(U×O)】×106 根据DPMO的值,查找标准正态分布表,找到Z,即为西水平格玛
计算 1、计算DPMO DPMO=【D/(U×O)】×106 经查表得此时西格玛水平为3.4 __8____ ×106 =320 2500×10
练习I 一家线缆制造商希望评估线缆的直径是否符合规格。线缆直径必须为 0.55 + 0.05 cm 才符合工程规格。分析员评估过程的能力以确保其满足客户的要求,即 Cpk 为 1.33。分析员每小时从生产线中取 5 根连续的线缆作为一个子组,并记录直径。 Data/线缆.MTW
综 合 案 例
能力分析 首先绘制你所被告知的流程。 在Minitab中执行能力分析。 我们第一步是判定分布的特性。 正态检验 当数据不是正态时我们第一步该做什么?
缩窄范围 让我们从主效果图开始
拆分工作表 数据》拆分工作表
数据表子设定
能力分析
总结 几种图表方法已经被可以使用 班次shift 对漏斗Filler 1 没有什么影响 班次shift 对漏斗Filler 2 影响很大 漏斗Filler 1,灌注头Head 3 看来导致瓶子灌不满 漏斗Filler 2 ,灌注头Head 6 看来导致瓶子灌太多
测量系统分析 Measurement System Analysis 质量工具篇之 测量系统分析 Measurement System Analysis
基本概念 测量系统 对测量单元进行量化或对被测的特性进行评估,其所使用的仪器或量具、标准、操作、方法、夹具、软件、人员、环境及假设的集合;也就是说,包含获得测量结果的整个过程。 测量系统分析 对测量系统进行评估,验证其是否在合适的特性位置测量了正确的参数,确定其需要具备哪些可被接受的统计特征,以便了解测量结果的变异来源及其分布。
变异分类 偏置 重复性 线性 稳定性 总体变异 抽样的随机性 短期流程变异 与测量人员相关的变异 与测量方法相关的变异 长期流程变异 流程实际变异 测量观察变异 再现性 分辨力
准确度和精确度
稳定性 稳定性(Stability, drift): 随时间变化的偏倚值 一个稳定的测量过程在位置方面处于统计上受控状态
线性 线性(linearity): 测量系统在整个预期的工作范围内的偏倚变化。 测量系统在整个操作范围的多个独立的偏倚误差的相互关系。
分辨力 分辨力(discrimination, resolution): 能产生一个可探测到的输出信号的最小输入
重复性 重复性(repeatability): 一个评价人使用一件测量仪器,对同一零件的某一特性进行多次测量下的变差 是在固定的和已定义的测量条件下,连续(短期内)多次测量中的变差 通常被称为设备变差(Equipment Variation) 设备(量具)本身的能力或潜能 系统内部变差
再现性 再现性(reproducibility): 由不同的评价人使用同一种测量仪器及同一种测量方法,多次测量同一零件的同一特性时获得的测量平均值的变差。 通常是指不同评价人变差
测量系统评估
测量系统评估 收集N (5 -10) 样品以代表长期流程变异。 选择能平常进行测量的3个操作员。 准备Minitab 数据表栏标题分别为:部品,操作员 让每个操作员单独随机地测量所有的样品一次。 重复上一步两遍或以上。 输入数据。
测量系统分类
实例演练 某食品厂生产袋装糖果。现随机抽取10包糖果请3位检验员用秤测量其重量,每人每包测3次,结果如下表。试做测量系统分析。
量具重复性与再现性 之一
属性一致性分析
Kappa 评判参考 < 0.7 测量系统应引起关注 0.7 – 0.9 测量系统可接受 > 0.9 测量系统优良
Kappa 应用示例 结果一致的比例: P观测 = 0.7 随机产生的一致比例: P偶然 = (P Insp1 Good) (P Insp2 Good) + (P Insp1 Bad)(PInsp2 Bad) P偶然 = (.8)(.5) + (.2)(.5) = .5 Kappa 计算 P观测 – P偶然 Kappa = 1 – P偶然 1. 如果两个人对每一张发票对保持同样的评价,Kappa=? 2. Kappa等于零说明什么? 3. 如果两个人对每一张发票对保持不一样的评价,Kappa=?
数据列表 Appraiser Sample Rating Attribute Zhao 1 2 6 11 -2 Qian Sun Li Zhou -1 7 12 3 8 13 4 9 14 5 10 15
属性一致性分析 之二
试验设计 Design Of Experiment 质量工具篇之 试验设计 Design Of Experiment
DOE的基本概念 试验设计(Design Of Experiment,简称 DOE),是对过程或产品进行改善或优化,找出最佳关键因子的方法。
DOE的起源与发展 20世纪20年代,费雪(Ronald Fisher)在农业试验中首次提出,并与统计分析方法相结合成为生物学、农学、遗传学研究的重要方法。 20世纪50年代,田口玄一博士(Dr. Genichi Taguchi)科学地将其应用于企业管理,使日本产品在国际上逐步树立了高质量的信誉。
DOE的益处 合理使用DOE能够: 减少实验次数,降低成本; 可按项目要求扩大或缩小实验规模; 量化变量的影响力,了解变量之间的相互联系; 优化产品或过程的性能。
DOE的基本策略 确定问题 选择自变量X 收集数据 建立目标 选择因子水平 分析数据 选择因变量Y 进行实验 作出结论
DOE家族 Fractional Factorials Full Factorials Response Surface 筛选 描述 优化
DOE术语 因子 (Xs): 输出或者响应变量 (Y): 因子水平: 试验顺序: 主效应: 交互效应: 系数:
2k 因子 定义: 2k 是指共有 k 个因子, 每个因子只有 2 个水平。 优点: 运行次数较少,计算分析相对较容易。 适合于早期试验,更是相对复杂试验的基础。
主因子作用 A的主效应 Y -1 +1 – 所有观测值在高水平 (+)平均值 所有观测值在低水平 (-)平均值 = 主效应
B烘烤时间 32) 52) 主效应 = (78 4 (46 + - 烤炉温度 烘烤时间 含水量% 评分 -1 46 1 48 78 34 80 52 Total - -160 Total + 258 Sum 98 Mean Eff 24.5 主效应 = (78 4 (46 + -
交互作用 在农田实验中,考虑两个因子,每个因子2水平,A:浇水。低水平:少水,高水平:多水。B:施肥。低水平:肥少,高水平:肥多。以产量Y为相应变量 A B 水少 水多 肥少 100 120 肥多 130 150 当B处于高水平时,A的效应:150-130=20 当B处于低水平时,A的效应:120-100=20 当A处于高水平时,B的效应:150-120=30 当A处于低水平时,B的效应:130-100=30
有交互作用 水少 水多 肥少 100 120 肥多 130 170 A B 当B处于高水平时,A的效应:170-130=40
交互作用 AB交互作用【 ( A+B++A-B-)-(A+B-+A- B+)】/2
计算 AxC Rating A B C AxB BxC AxBxC -1 -1 -1 1 1 1 -1 46 1 -1 -1 -1 -1 1 48 -1 1 -1 -1 1 -1 1 78 1 1 -1 1 -1 -1 -1 48 -1 -1 1 1 -1 -1 1 34 1 -1 1 -1 1 -1 -1 32 -1 1 1 -1 -1 1 -1 80 1 1 1 1 1 1 1 52 Total - -238 -160 -220 -238 -210 -192 -206 Total + 180 258 198 180 208 226 212 Sum -58 98 -22 -58 -2 34 6 Mean -14.5 24.5 -5.5 -14.5 -0.5 8.5 1.5
2 3 8 - IV 符号说明 8 Factors = 1/8 fraction; Since 8 – 3 = 5, the design has 5 = 32 runs; 32 is 1/8 of 256 (full factorial = 2 = 256 runs) 2 Levels Resolution IV means: n Main effect confounded with 3 factor interactions (1 + 3 = 4) factor interactions confounded with other factor interactions (2 + 2 = 4)
DOE构建 之二
DOE构建 之四
DOE构建 之六
DOE分析 之二
DOE分析 之五
DOE分析 之七
DOE分析 之九
DOE图示 之七
案例分析 一瓷砖设计工程师欲探测影响瓷砖表面细颗粒脱落的影响 因素----细颗粒的脱落将严重影响瓷砖的美观度和耐用性,根据团队的头脑风暴,找出6个影响瓷砖表面颗粒脱落的 因子,通过实验来找出哪些因子或因子的交互作用是显著的。 SHINGLE.MTW
Enjoy Minitab Enjoy Quality 谢 谢