信息技术与数学教学 华东师范大学数学系 万福永 第九讲 几种假设检验的Excel实现
一、常见的概率分布 (一) 教育统计理论基础 (二)在Excel软件中的实现 (三)实际应用实例与Excel解答 二、差异显著性检验 (一)教育统计理论基础 三、差异显著性检验之一:单侧检验 四、差异显著性检验之二:双侧检验
一、常见的概率分布 (一) 教育统计理论基础 1. 二项分布:是一种离散型随机变量的概率分布
一、常见的概率分布 (一) 教育统计理论基础 2. 正态分布:是一种连续型随机变量的概率分布
一、常见的概率分布 (二)在Excel软件中的实现 1. BINOMDIST(k,n,p,0):计算二项分布的分布律;
一、常见的概率分布 (二)在Excel软件中的实现 语法:BINOMDIST (Number,Trials,Probability,Cumulative) 参数:Number为实验成功的次数,Trials为独立实验的次数,Probability为一次实验中成功的概率,Cumulative是一个逻辑值,用于确定函数的形式。如果Cumulative为TRUE,则BINOMDIST函数返回累积分布函数,即至多Number次成功的概率;如果为FALSE,返回概率密度函数,即Number次成功的概率。
一、常见的概率分布 (二)在Excel软件中的实现 1. BINOMDIST(k,n,p,0):计算二项分布分布律; BINOMDIST(k,n,p,1):计算二项分布累积分布。 实例:抛硬币的结果不是正面就是反面,第一次抛硬币为正面的概率是0.5,则掷硬币10次正面朝上6次的概率为“=BINOMDIST(6, 10, 0.5, FALSE)”,计算的结果等于0.205078。 累积概率为“=BINOMDIST(6, 10, 0.5, TRUE)”,计算的结果等于0.828125。
一、常见的概率分布 (二)在Excel软件中的实现 2. NORMDIST(x,µ,σ,0) :计算正态分布N(µ,σ2)的概率密度函数 f(x) 在 x 处的函数值; NORMDIST(x,µ,σ,1) :计算正态分布N(µ, σ2)累积分布函数 F(x) 在 x 的函数值。 【NORMDIST函数详解】: 用途:返回给定平均值和标准差的正态分布的概率密度函数/分布函数的值。
一、常见的概率分布 (二)在Excel软件中的实现 语法:NORMDIST(X, Mean, Standard_dev, Cumulative) 参数:X为需要计算其分布的数值 ,Mean是分布的算术平均值,Standard_dev是分布的标准方差;Cumulative为一逻辑值,指明函数的形式。如果Cumulative为TRUE,则NORMDIST函数返回累积分布函数;如果为FALSE,则返回概率密度函数。
一、常见的概率分布 (二)在Excel软件中的实现 实例: 公式“=NORMDIST(42, 40, 1.5, FALSE)” 返回概率密度函数值: 0.109340 。 公式“=NORMDIST(42, 40, 1.5, TRUE)” 返回累积分布函数值: 0.908789 。
一、常见的概率分布 例1:一个学生做10题正误题时,做对不同题数的概率分布 (假设:做对每题的概率p=1/2;做错的概率为1/2) (三)实际应用实例与Excel解答 例1:一个学生做10题正误题时,做对不同题数的概率分布 (假设:做对每题的概率p=1/2;做错的概率为1/2) 做对题数 1 2 3 4 5 6 7 8 9 10 出现方式数 45 120 210 252
一、常见的概率分布 B3中输入的计算公式是=BINOMDIST(A3,$B$1,$B$2,0), 而C3中输入的计算公式是=BINOMDIST(A3,$B$1,$B$2,1);
正态分布图 偏正态分布
二、差异显著性检验 (一) 教育统计理论基础 1. 假设检验的基本原理 零假设(虚无假设):是关于当前样本所属的总体(指参数)与假设总体(指参数)无区别的假设,一般H0表示。 备择假设(研究假设):是关于当前样本所属的总体(指参数)与假设总体(指参数)相反的假设,一般用H1表示。 由于直接检验备择假设的真实性困难,假设检验一般都是从零假设出发,通过零假设的不真实性来证明备假设的真实性。
二、差异显著性检验 (一) 教育统计理论基础
(a)左侧检验 (b)右侧检验 (c)双侧检验 二、差异显著性检验 (一) 教育统计理论基础 (a)左侧检验 (b)右侧检验 (c)双侧检验
二、差异显著性检验 (一) 教育统计理论基础 2. 显著性水平 两种水平: (1)α=0.05,显著性水平为0.05,即统计推断时可能犯错误的概率5%,也就是在95%的可靠程度上进行检验; (2) α=0.01,显著性水平为0.01,即统计推断时可能犯错误的概率1%,也就是在99%的可靠程度上进行检验。
二、差异显著性检验 (一) 教育统计理论基础 3. 小概率事件 在随机事件中,概率很小的事件被称为小概率事件,习惯上约定在0.05以下,即当P(A)< 5%时,则称A为小概率事件。在统计推断中认为,小概率事件在一次试验或观察中是不可能发生的。
二、差异显著性检验 (二)在Excel软件中的实现 1. 假设检验方法 在Excel中作假设检验可用函数的方法或数据分析工具中的方法。检验用的函数名称最后四个英文字母为英文单词“TEST”,前面的字母为所用统计量的名称。常用的检验法的函数有: TTEST: t 分布检验法; ZTEST: 正态分布检验法; FTEST: F 分布检验法; CHITEST: 卡方分布检验法。 Excel中对于假设检验问题给出的是p 值。
二、差异显著性检验 (二)在Excel软件中的实现 【ZTEST函数详解】: 用途:返回Z检验的双尾p值。Z检验根据数据集或数组生成x的标准得分,并返回正态分布的双尾概率。可以使用此函数返回从某总体中抽取特定观测值的似然估计。 语法:ZTEST (array,x,sigma) 参数:array为用来检验x的数组或数据区域。x为被检验的值。sigma为总体(已知)标准差,如果省略,则使用样本标准差。 实例:公式“=ZTEST({3,6,7,8,6,5,4,2,1,9},4)”返回0.090574。
二、差异显著性检验 (二)在Excel软件中的实现 2. P 值检验法简介
二、差异显著性检验 (二)在Excel软件中的实现
二、差异显著性检验 (二)在Excel软件中的实现
二、差异显著性检验 (二)在Excel软件中的实现
二、差异显著性检验 (二)在Excel软件中的实现
二、差异显著性检验 (二)在Excel软件中的实现 3. 其它相关函数
二、差异显著性检验 (二)在Excel软件中的实现
二、差异显著性检验 (二)在Excel软件中的实现
二、差异显著性检验 (二)在Excel软件中的实现
二、差异显著性检验 (二)在Excel软件中的实现
二、差异显著性检验 (二)在Excel软件中的实现
二、差异显著性检验 (三)实际应用实例与Excel解答 例9 (单样本左侧Z 检验):某市高一学生的平均体重为68公斤,标准差为8.6,今年体检后知道该市香茗中学高一学生的46名学生的平均体重为64.5公斤。过去的资料表明:往年香茗中学高一学生的平均体重低于全市平均水平。问今年香茗中学高一学生的平均体重是否仍显著低于全市的平均水平?
二、差异显著性检验 【手动理论求解 】 分四步完成:
二、差异显著性检验
二、差异显著性检验
二、差异显著性检验
二、差异显著性检验 【手动Excel求解】 自己手工用Excel的有关函数进行求解
二、差异显著性检验 可以用两种完全等价的方法来判定检验的结果: (1) p 值检验法:此z 统计量的概率值为0.0029,小于显著性水平(=0.01),所以在显著性水平0.01下(或者说在99%的可靠程度上)拒绝原假设H0,接受备择假设H1。 (2) 临界值检验法:此z 统计量的观测值-2.76,它小于统计量的临界值-2.33(更小于另一个临界值-1.64),所以在显著性水平0.01下(或者说在99%的可靠程度上)有显著差异,因此要拒绝原假设,接受备择假设,而且其差异还是极其显著性的。 不管怎么看,结论都一样:今年香茗中学高一学生的平均体重64.5极其显著低于全市的平均水平68。
三、差异显著性检验之一:单侧检验 1. 零假设与备择假设 2. 显著性水平α VS 可靠程度1-α 3. 小概率事件 4. 单样本Z 检验(单侧)的2个例子 单样本数不小于30时,要用Z 检验(有的教材也称为U 检验)
三、差异显著性检验之一:单侧检验 例10 (单样本左侧Z 检验) :某市高中入学考试数学平均成绩为68分,标准差为8.6,其中某甲中学参加此次考试的46名学生的数学平均分为65。过去的资料表明:该校数学平均成绩低于全市平均水平。问此次考试甲校数学平均分数是否仍显著低于全市的平均分数?
三、差异显著性检验之一:单侧检验 (b)左侧检验: 左侧有阴影部分为拒绝域 中间+右侧的白色部分为接受域
三、差异显著性检验之一:单侧检验 单侧(左侧)Z检验统计决断规则 Z与临界值比较 P值 检验结果 Z>-1.64=Z0.05 P>0.05 在0.05显著水平上保留H0, 拒绝H1 -1.64 ≥Z> -2.33 0.01<P ≤0.05 在0.05显著水平上拒绝H0, 接受H1。 Z≤ -2.33=Z0.01 P≤0.01 在0.01显著水平上拒绝H0,
三、差异显著性检验之一:单侧检验
三、差异显著性检验之一:单侧检验 例11 (单样本右侧Z 检验) :某市高中入学考试数学平均成绩为68分,标准差为8.6,其中某乙中学参加此次考试的42名学生的数学平均分为71。过去的资料表明:该校数学平均成绩高于全市平均水平。问此次考试乙校数学平均分数是否仍显著高于全市的平均分数?
三、差异显著性检验之一:单侧检验 (c)右侧检验: 右侧有阴影部分为拒绝域 左侧+中间的白色部分为接受域
三、差异显著性检验之一:单侧检验 单侧(右侧)Z检验统计决断规则 Z与临界值比较 P值 检验结果 Z< 1.64=Z0.05 P>0.05 在0.05显著水平上保留H0, 拒绝H1 1.64 ≤ Z < 2.33 0.01<P ≤0.05 在0.05显著水平上拒绝H0, 接受H1。 Z≥ 2.33=Z0.01 P≤0.01 在0.01显著水平上拒绝H0,
三、差异显著性检验之一:单侧检验
三、差异显著性检验之一:单侧检验 5. 双样本单侧Z 检验(无例子) 6. 单样本单侧t 检验(无例子) 7. 双样本单侧t 检验 双样本均N1、N2 有一个小于30,要用t检验 一个例子:例12 (双样本右侧t 检验)
三、差异显著性检验之一:单侧检验 例12(双样本右侧t 检验):从高二年级随机抽取两个小组(分成:实验组与对照组),在数学课中对于实验组采用启发探究法,至于对照组则采用传统教授法。后期统一测试后的分数如下,问两种教学法有无显著性差异?(根据已有的经验确知:启发探究法优于传统教授法) 实验组:64, 58, 65, 56, 58, 45, 55, 63, 66, 69 对照组:60, 59, 57, 41, 38, 52, 46, 51, 49
三、差异显著性检验之一:单侧检验
三、差异显著性检验之一:单侧检验
四、差异显著性检验之二:双侧检验 1. 零假设与备择假设 2. 显著性水平α VS 可靠程度1-α 3. 小概率事件 4. 单样本双侧Z 检验 单样本数不小于30时,要用Z 检验(有的教材也称为U 检验) 一个例子:例13(单样本双侧Z 检验)
四、差异显著性检验之二:双侧检验 (a)双侧检验: 两端有阴影部分为拒绝域 中间的白色部分为接受域
四、差异显著性检验之二:双侧检验 例13 (单样本双侧Z 检验) :某小学历届毕业生汉语拼音测试平均分数为66分,标准差为11.7。现以同样的试题测试应届毕业生(假设应届与历届毕业生条件基本相同),并从中随机抽36份试卷,算得平均分为69分,问该校应届与历届毕业生汉语拼音测试成绩是否有显著性差异?(alpha=0.05)
四、差异显著性检验之二:双侧检验
四、差异显著性检验之二:双侧检验 5. 双样本双侧Z 检验 双样本均为大样本,N1、N2 都大于30,并标准差相差不很大。(N小于30要用t 检验) 一个例子:例14 (双样本双侧Z 检验)
四、差异显著性检验之二:双侧检验 例14 (双样本双侧Z 检验) :某校高一进行数学教改实验,若实验前两班的化学成绩无显著性差异,实验一段时间后的数学测验成绩,实验班51名为均分为62.37,标准差为13.65,对照班45名学生的均分为56.16,标准差为16.37,试进行差异性检验。
四、差异显著性检验之二:双侧检验 (1)提出假设 零假设H0:μ1=μ2(实验班和对照班样本来自同一个总体)。 (2)选择统计量,计算其值 (3)确定显著水平 α=0.05。 (4)统计决断 |Z|=2.0 > 1.96,则P<0.05,拒绝零假设。实验班和对照的化学成绩存在显著差异。
四、差异显著性检验之二:双侧检验
四、差异显著性检验之二:双侧检验 双侧Z检验统计决断规则 |Z|与临界值比较 P值 检验结果 |Z|<1.96=Z0.05/2 P>0.05 在0.05显著水平上保留H0, 拒绝H1 1.96≤|Z|< 2.58 0.01<P ≤0.05 在0.05显著水平上拒绝H0, 接受H1。 |Z|≥2.58=Z0.01/2 P≤0.01 在0.01显著水平上拒绝H0,
四、差异显著性检验之二:双侧检验 6. 单样本双侧t 检验 单样本数小于30时,要用t 检验 一个例子:例15(单样本双侧t 检验)
四、差异显著性检验之二:双侧检验 例15(单样本双侧t 检验):某区初三英语统一测验平均分数为65,该区某校20份试卷的分数为:72, 76, 68, 78, 62, 59, 64, 85, 70, 75, 61, 74, 87, 83, 54, 76, 56, 66, 68, 62。问该校初三英语平均分数与全区是否一样?
四、差异显著性检验之二:双侧检验
四、差异显著性检验之二:双侧检验 7. 双样本双侧t 检验 双样本N1、N2有一个小于30,要用t 检验) 一个例子:例16 (双样本双侧Z检验)
四、差异显著性检验之二:双侧检验 例16 (双样本双侧t检验) :现有10名自由体操运动员,他们训练前后的两次得分如下: 前:16,14,18,20,15,19,17,21,24,23 后:20,14,16,21,19,15,15,19,22,22 问:讨论训练前后的得分有无显著差异? (alpha=0.05)
四、差异显著性检验之二:双侧检验 【方差齐性检验】
四、差异显著性检验之二:双侧检验 【解法一】直接使用Excel统计分析功能求解
四、差异显著性检验之二:双侧检验 【解法二】自己手工用Excel的有关函数进行求解