方差分析 ANOVA 助教 李婕 2003年11月21日.

Slides:



Advertisements
Similar presentations
质数和合数 中心小学 顾禹 人教版小学五年级数学下册 一、激趣导入 提示:密码是一个三位 数,它既是一个偶数, 又是 5 的倍数;最高位是 9 的最大因数;中间一位 是最小的质数。你能打 开密码锁吗?
Advertisements

因数与倍数 2 、 5 的倍数的特征

3 的倍数的特征 的倍数有 : 。 5 的倍数有 : 。 既是 2 的倍数又是 5 的倍数有 : 。 12 , 18 , 20 , 48 , 60 , 72 , , 25 , 60 ,
2 和 5 的倍数的特征 运动热身 怎样找一个数的倍数? 从小到大写出 2 的倍数( 10 个): 写出 5 的倍数( 6 个) 2 , 4 , 6 , 8 , 10 , 12 , 14 , 16 , 18 , 20 5 , 10 , 15 , 20 , 25 , 30.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
数据结构的引入. 通讯录管理 社团机构管理 校园导航管理 通讯录管理 社团机构管理 校园导航管理.
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
2 、 5 的倍数特征 集合 2 的倍数(要求) 在百数表上依次将 2 的倍数找出 并用红色的彩笔涂上颜色。
教材版本:新教材人教版九年级(上) 作品名称:同类二次根式 主讲老师:张翀 所在单位:珠海市平沙第一中学.
第六章 方差分析 (Analysis of Variance,ANOVA)
15 簡單迴歸分析與相關分析  學習目的.
完全随机设计多样本资料秩和检验.
常用逻辑用语复习课 李娟.
第三节 函数的求导法则 一 函数的四则运算的微分法则 二 反函数的微分法则 三 复合函数的微分法则及微分 形式不变性 四 微分法小结.
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
余角、补角.
初中数学 七年级(上册) 6.3 余角、补角、对顶角(1).
问:图中∠α与∠β的度数之间有怎样的关系?
探索三角形相似的条件(2).
初中数学八年级下册 (苏科版) 10.4 探索三角形 相似的条件(2).
禪宗的教外別傳.
第一节 单因素方差分析 第二节 双因素方差分析 第三节 正交实验设计及方差分析
第13章變異數分析與多變數分析  本章的學習主題 
Created on Jun. 9th, 2009 By Dr. Wei-Mann Lee
ANOVA簡介 許晉誠
第13章變異數分析與多變數分析  本章的學習主題  1. 變異數分析的應用時機 2. 變異數分析的假設前提
Test for difference among the means: t Test
十、變方分析 (Analysis of Variance) (Chapter 10)
第十章 方差分析.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
绿色圃中小学教育网 比例 比例的意义 绿色圃中小学教育网
第七章 参数估计 7.3 参数的区间估计.
指導老師:蘇明俊 組員: 陳柔安 潘依蓮 張壹凱
6.4不等式的解法举例(1) 2019年4月17日星期三.
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
模型分类问题 Presented by 刘婷婷 苏琬琳.
完全随机设计多组资料的比较 赵耐青 卫生统计教研室.
复习.
用统计学方法研究电商平台上的产品销售特征
实体描述呈现方法的研究 实验评估 2019/5/1.
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第4章 Excel电子表格制作软件 4.4 函数(一).
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
人教版小学数学三年级上册 认识几分之几 gjq.
第4课时 绝对值.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第四节 多个样本均数的两两比较 多个样本均数的两两比较又称多重比较(multiple comparison),其目的是推断究竟哪些总体均数之间存在差别。
分数再认识三 真假带分数的练习课.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
2.2直接证明(一) 分析法 综合法.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
第八章 假设检验 8.1 假设检验的基本概念.
2.3.运用公式法 1 —平方差公式.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
第八章 方差分析(analysis of variance)
Statistical Methods in Medicine
欢迎大家来到我们的课堂 §3.1.1两角差的余弦公式 广州市西关外国语学校 高一(5)班 教师:王琦.
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
两位数加一位数和整十数 (不进位) 翠屏小学 张兴权.
回归分析实验课程 (实验三) 多项式回归和定性变量的处理.
找 因 数.
FH实验中电子能量分布的测定 乐永康,陈亮 2008年10月7日.
庄文忠 副教授 世新大学行政管理学系 变异数分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2019/8/12.
高中物理“平抛运动的应用” 点评专家:谭一宁.
慧能的教外別傳.
Sssss.
Presentation transcript:

方差分析 ANOVA 助教 李婕 2003年11月21日

已经学过的知识 一位研究者对长子与次子的心理特征感兴趣。他在一年级大学生中随机抽取了10个长子和20个非长子对其施测自尊量表。10个长子在量表上的平均分是X = 48, SS=670。 20个非长子的平均分是X = 41, SS=1010。这些数据表明两组间是否有显著差异?用α= .01 的显著性水平作假设检验。

一个新的情境 一位研究者感兴趣影响儿童阅读能力的因素.研究者认为儿童的年龄和每次阅读时间可能是重要的影响因素。研究者设计了以下实验:选取三个年龄组的儿童: 3 岁, 8 岁, 和 14 岁.将每个年龄组的儿童随机分配到三个阅读条件. 组 1阅读时间为 5 分钟; 组 2为15 分钟; 对于组 3为30 分钟.两个星期之后测试了这些儿童的阅读能力。    

  阅读时间 5 分钟 15 分钟 30 分钟 年龄 3 岁 8 岁 14 岁 3*3个共9个单元格,如何分析数据?

分析 t-检验和 z-检验不能用于多于 2 组的数据. 处理这类数据需要用一种新的推论统计程序: 方差分析 (ANOVA). (为什么)

这次课的内容 最基本的ANOVA.集中讨论单因素, 独立测量的研究设计. 1. ANOVA的简介 2. ANOVA的逻辑 5.     事后检验

ANOVA简介(1) 方差分析即analysis of variance,简称ANOVA。 功能:分析实验数据中不同来源的变异对总变异的贡献大小,确定实验中的自变量是否对因变量有重要影响。

方差的来源 什么造成样本的不同(处理间变异) 每一个样本内部的变异 (处理内变异) 处理/组效应 - 处理造成的差异 个体差异效应 - 个体差异变异 随机误差 每一个样本内部的变异 (处理内变异) 个体差异效应 随机误差

ANOVA简介(2) 在方差分析中, 自变量称为因素. 包含一个自变量的研究称为单因素设计(single-factor design). 具有多于一个自变量研究称为因素设计(factorial design). 构成因素的个别处理条件称为因素的水平

ANOVA简介(3) ANOVA能够处理数据的类型: 两个自变量 (称为因素): 年龄和阅读时间,都是组间 (独立样本) 变量. 包含组内 (重复测量) 因素的研究设计 同时包含组间和组内因素的混合设计(e.g. 假设上例中我们用同一些儿童作纵向研究。年龄是组内变量,阅读时间是组间变量). 上述研究称为因素设计, 两个组间因素,每一个因素有 3 个水平 (称为 3 X 3 组间设计).

ANOVA逻辑 与假设检验的逻辑是同样的, 只是具体内容有变化 step 1: 陈述 H0 (和H1) ,确定标准: a = ? step 2: ANOVA 检验总是 单尾(不同之处) step 3: 指出检验的df (有两个 df) step 4: 查表找出临界 F统计量 step 5: 对于样本,计算 F统计量 step 6: 比较 F统计量 和临界 F统计量 step 7: 对于H0 作出结论

单因素, 独立测量研究设计的例子 检验三个不同的学习方法的效应。将学生随机分配到3个处理组 方法 A:让学生只读课本, 不去上课. 方法 B:上课,记笔记,不读课本. 方法 C:不读课本,不去上课, 只看别人的笔记

单因素, 独立测量研究设计的例子 Step 1: 陈述假设和设定标准 (选择 a) H0: m1 = m2 = m3 m1不等于 m2 = m3 m1 = m3 不等于 m2 m1 = m2 不等于 m3 m1 不等于 m2 不等于 m3 因此,只需给出虚无假设就够了

单因素, 独立测量研究设计的例子 step 2: ANOVA 检验总是单尾. 因为不存在负的方差. F分布表也只有单侧的Alpha.(F分布图) step 3: 找出检验的 df. 注意要考虑几个 df step 4: 从表找出临界 F统计量 step 5:计算样本 的F统计量观测值 step 6:比较 F统计量的观测值与临界 F统计量 如果 F统计量的观测值 (Fobs) 在统计上显著地大于 1.0 则拒绝 H0

单因素, 独立测量研究设计的例子 F<或=1, 即MS组间/ MSw组内<1,说明数据的总变异由分组不同造成的变异只占很小的部分,大部分是由试验误差何个体差异所致,就是说不同的实验处理之间变异不大,或者说试验处理基本无效。 F>1而且落入F分布的临界区,说明实验数据的变异由不同的实验处理所造成,即不同的试验处理之间有差异。

   ANOVA的专用符号    K = 处理条件(或组)的数目 n = 每一个组的数目(如果它们相等) ni = 第i组的数目(如果 它们不等) N = Sni = 总的样本容量 Ti = SXij G = SXij =总的和 G-bar = G / N = 总的均值 SSi = 每一个组的和方 = S(Xij - i)2

研究方法 4 1 3 2 6 T1 = 5 T2 = 20 T3 = 5 SS1 = 6 SS2 = 6 SS3 = 4 n1 = 5 方法 A 只读课本 方法 B 只作笔记 方法 C 借别人笔记 4 1 3 2 6 T1 = 5 T2 = 20 T3 = 5 SS1 = 6 SS2 = 6 SS3 = 4 n1 = 5 n2 = 5 n3 = 5 1 = 1 2 = 4 3 = 1

SX2=106 G=30=总的和 N=15=总的样本容量 G-bar=30/15=2= 总的均值 K = 3 =处理条件 (或组)

ANOVA的过程 F比率 = 处理间方差 /处理内方差( 需要找出两个方差. ) 最基本公式s2 = SS/df. SS和 = SX2 - (G2/N) SS和 = 106 - (302/15) =106 - 60 = 46 需要将其分解为组间变异和组内变异. SS和 = SS组间 + SS组内 如何得到SS组内? 将每一个组SS相加 SSwithin = SSS每一个 处理内部 = SSSi= 6 + 6 + 4 = 16 如何得到SS组间? 快捷的方法是: SS和- SS组内

注意 不推荐用这种方法, 因为: 无法检查计算错误 未涉及SS组间 是如何组成.

直接计算 SS组间的两个公式 :定义公式和计算公式 定义公式:SS间 = S[ni( X-bar- G-bar)2] = 5(1 - 2) 2 + 5(4 - 2) 2 + 5(1 - 2)2 = 5 + 20 + 5 = 30 计算公式:SS间 = S(T2/ni) - G2/N = 52/5 + 202/5 + 52/5 - 302/15 = 5 + 80 + 5 - 60 SS和 = SS组间 + SS组内 = 16 + 30 = 46 s2 = SS/df.

df 共有两个 (或三个) 自由度, 一个组间方差df,一个组内方差df (以及一个总的 df). df和 = N - 1 df组内 = = N - K df组间= K - 1 df和 = df组内 + df组间

df 在例子中: df组内 = 15 - 3 = 12 df组间= 3 - 1 = 2

均方:计算方差. 方差 = 均方 = MS = SS/df MS组间= SS组间/df组间 --> 上例中 = 30/2 = 15 --> 上例中 = 16/12 = 1.33

F比率 F比率 = 处理间方差/处理内方差 = MS组间 / MSw组间 上例中的F比率是: 15/1.33 = 11.28

查 F表 确定 Fcrit 对假设作出结论 df组间 = 分子的df df组内 = 分母的df (误差) 如果选择 a = .05, Fcrit = 3.88 如果选择 a = .01, Fcrit = 6.93 F比率的观测值11.28> Fcrit., 所以拒绝 H0 (m1 = m2 = m3). 报告结果 F(df组间,df组内) = Fobs, p < ?

报告结果 单因素方差分析发现学习方法有显著的效应, F(2,12) = 11.28, p < 0.01.

事后检验(Post hoc tests)1 ANOVA 的结果是检验H0: m1 = m2 = m3 ,并未提供哪个备择假设得到支持. 也就是说, 只知道一些组与其它组不同, 但并知道差别在哪些组之间. 所以从ANOVA得到显著差异的结果 (拒绝H0)后,一定要做作事后检验. 事后检验 使我们能够比较各组, 发现差异产生在什么地方. 事后检验就是比较每一个处理组与另一个处理组, 一次比较两个. 这称为成对比较.

事后检验(Post hoc tests)2 在上例中, 可以比较 m1 与 m2, m1与 m3, 以及 m2与 m3. 这样的做法有没有问题? 每一个比较 都是一个单独的假设检验, 每一个都有犯I类错误的风险. 所以,比较对数越多, 作结论的风险越大。即容易发现实际不存在的差异。 这称为实验导致的(experimentwise)alpha 水平 (或族系(familywise) 误差)

事后检验(Post hoc tests)3 αEW = 1 - (1 - a)c c = 比较对数 I类错误的机会增加到14.7%而不再是5%,多数事后检验设计中都控制了实验导致误差.

事后检验(Post hoc tests)4 介绍两个事后检验: Tukey's HSD 检验 (honestly差异显著性) 检验和 Scheff 检验.

a) Tukey's HSD 检验 可以计算出单一的值确定处理均值间的最小差异,考查此差异在统计上是否显著. 此检验要求各组有相等的样本容量. HSD = q * sqrt(MS组内/n) q 值 可以从表中查出(附表6). 需要用到K和 df组内, 以及αEW

举例 在上例中 (用αEW = .05): HSD = q * sqrt(MS组内/n)=(3.77) sqrt(1.33/5) = (3.77)(.516) = 1.94 比较 1: H0: m1 = m2 2 -1 = 4.0 - 1.0 = 3.0 HSD = 1.94 < 3.0,拒绝 H0 比较 2: H0: m1 = m3 3 -1 = 1.0 - 1.0 = 0.0 HSD = 1.94 > 0.0,不能 拒绝 H0 比较 3: H0: m2 = m3 2 -3 = 4.0 - 1.0 = 3.0 HSD = 1.94 < 3.0, 拒绝 H0 所以 B 与 A 和 C不同,而A 与 C 没有差异

b)     ScheffŽ检验 用F比率检验差异. 这是最保守的检验 (降低 I类错误的风险, 但增加II类错误的风险). 特别适用于n 不等的情况  重新计算 MS组间, 每次只检验一个比较.注意:用整体的 df组间 和整体的MS组内.

举例:比较 1 H0: m1 = m2 SS组间 == 52/5+202/5-252/10 = 22.5 F比率 = MS间/MS组内= 11.25/1.33 = 8.46 查 F表. a = .05, Fcrit(2,12) = 3.88 8.46 > 3.88, 拒绝 H0

举例:比较 2 H0: m1 = m3 SS组间== 52/5+52/5-102/10= 0 MS组间 =0/2 = 0 F比率 = MS间/MS组内= 0/1.33 = 0 查 F表. a = .05, Fcrit(2,12) = 3.88 0 < 3.88, 不能拒绝 H0

举例:比较 3 H0: m2 = m3 SS组间 ==52/5+202/5-252/10 = 22.5 F比率 = MS间 /MS组内 = 11.25/1.33 = 8.46 查 F表. a = .05, Fcrit(2,12) = 3.88 8.46 > 3.88, 拒绝 H0

与t-检验的关系 差异间独立样本 t-检验与两个水平的单因素组间 ANOVA有何区别? 没有. F比率 = t2 差异间t-检验和 ANOVA, t-检验是考察两个均值间的差异ANOVA 是考察方差. 如果只有两个组, t 统计量的平方就是F 统计量.

练习题 一位研究者研究三种键盘设计。记录了三组被试的错误次数: 键盘A: 0 4 0 1 0 键盘B: 6 8 5 4 2 键盘C: 6 5 9 4 6 键盘类型对打字错误有无显著的影响?