Download presentation
Presentation is loading. Please wait.
Published bySiska Darmadi Modified 6年之前
1
第八章 均值之差的推断 本章内容 8.1 两个总体均值之差推断的基本内容 8.2 独立样本均值之差检验 8.3 两总体方差差异检验
第八章 均值之差的推断 本章内容 8.1 两个总体均值之差推断的基本内容 8.2 独立样本均值之差检验 8.3 两总体方差差异检验 8.4 成对样本推断 下一页 返回目录 第8章 均值之差的推断
2
8.1 两个总体均值之差 推断的基本内容 8.1.1 两个总体均值之差的抽样分布 8.1.2 三种检验情况
8.1 两个总体均值之差 推断的基本内容 两个总体均值之差的抽样分布 三种检验情况 Excel双样本检验分析工具的内容 上一页 下一页 返回本章首页 第8章 均值之差的推断
3
8.1.1 两个总体均值之差的 抽样分布 假定从总体1中抽取一个随机样本,从总 体2 中抽取另一个随机样本。这两个样本的均值 之差为: 。
两个总体均值之差的 抽样分布 假定从总体1中抽取一个随机样本,从总 体2 中抽取另一个随机样本。这两个样本的均值 之差为: 。 根据第5章知识可知, =μ1, =μ2。 2 x m 上一页 下一页 返回本节首页 第8章 均值之差的推断
4
样本均值之差的抽样分布的标准差,称为两个均值之差的组合标准差,用下式表示:
如果两个总体的标准差未知,就用两个样本的标准差作为估计值,其公式为: 上一页 下一页 返回本节首页 第8章 均值之差的推断
5
s s s 如果是小样本,则可分成两种情况,一是虽然两个总体方差未知,但知道有 = 。这种情况下, 的估计量为: 上一页 下一页
如果是小样本,则可分成两种情况,一是虽然两个总体方差未知,但知道有 = 。这种情况下, 的估计量为: s 1 2 s 2 2 1 x - s 上一页 下一页 返回本节首页 第8章 均值之差的推断
6
当方差未知,且方差不等时,虽可采用上式,但此时抽样分布已不服从自由度为(n1+n2-2)的t分布,而是近似服从修正自由度为的t分布,的计算公式为:
上一页 下一页 返回本节首页 第8章 均值之差的推断
7
均值之差的参数估计的基本公式为: 2 1 ) ( n s t x p + - a 上一页 下一页 返回本节首页 第8章 均值之差的推断
8
8.1.2 三种检验情况 当从两个总体中抽取的样本不成对时,称其为 独立样本。Excel提供了三种对独立样本进行
三种检验情况 当从两个总体中抽取的样本不成对时,称其为 独立样本。Excel提供了三种对独立样本进行 假设检验的分析方法。三种方法的选择依赖于 两个总体所提供的方差。一般来说共有三种可 能,每种可能需要使用不同的计算方法。 上一页 下一页 返回本节首页 第8章 均值之差的推断
9
这种情况下根据两个样本的数据计算样本统计量z。 2.总体方差未知且两总体方差相等 需假设两个总体方差相等。 计算合并样本方差。
1. 总体方差已知 这种情况下根据两个样本的数据计算样本统计量z。 2.总体方差未知且两总体方差相等 需假设两个总体方差相等。 计算合并样本方差。 根据两个样本的均值和合并样本方差可以计算样本统计量t值。 t分布的自由度是n1+n2-2,n1和n2是两个样本的容量。 上一页 下一页 返回本节首页 第8章 均值之差的推断
10
一个从样本数据中计算出来统计量近似服从t分布,此检验称为t检验。 在Excel的输出中称其为“t Stat”。
3.总体方差未知且两总体方差不等 此种情况称为贝伦斯-费雪问题。 一个从样本数据中计算出来统计量近似服从t分布,此检验称为t检验。 在Excel的输出中称其为“t Stat”。 自由度由萨特思韦特逼近公式计算并取其最接近的整数。 然后再根据它和t分布得到P值和其他临界值进行推断。 上一页 下一页 返回本节首页 第8章 均值之差的推断
11
8.1.3 Excel双样本检验分析 工具的内容 F-检验:双样本方差 t-检验: 双样本等方差假设 t-检验: 双样本异方差假设
上一页 下一页 返回本节首页 第8章 均值之差的推断
12
双样本等方差检验对话框如图所示。 上一页 下一页 返回本节首页 第8章 均值之差的推断
13
变量1的区域:在此输入需要分析的第一个数据区域的单元格引用。该区域必须由单列或单行的数据组成。
对话框的主要内容包括: 变量1的区域:在此输入需要分析的第一个数据区域的单元格引用。该区域必须由单列或单行的数据组成。 变量2的区域:在此输入需要分析的第二个数据区域的单元格引用。该区域必须由单列或单行的数据组成。 假设平均差:在此输入期望中的样本均值的差值。0 值则说明假设样本均值相同。 上一页 下一页 返回本节首页 第8章 均值之差的推断
14
显著水平a:为第 I 类错误发生概率的显著性水平(弃真假设),该值必须在范围 0~1 之间。
标志:如果输入区域的第一行或第一列中包含标志项,请选中此复选框;如果输入区域没有标志项,请清除此复选框,Excel 将在输出表中自动生成数据标志。 显著水平a:为第 I 类错误发生概率的显著性水平(弃真假设),该值必须在范围 0~1 之间。 输出区域:在此输计算结果。如果输出表将覆盖已有的数据, Excel 会自动确定输出区域的大小并显示信息。 上一页 下一页 返回本节首页 第8章 均值之差的推断
15
新工作簿:单击此选项,可创建一新工作簿,并在新工作簿的新工作表中粘贴计算结果。
新工作表组:单击此选项,可在当前工作簿中插入新工作表,并由新工作表的 A1 单元格开始粘贴计算结果。如果需要给新工作表命名,请在右侧的编辑框中键入名称。 新工作簿:单击此选项,可创建一新工作簿,并在新工作簿的新工作表中粘贴计算结果。 上一页 下一页 返回本节首页 第8章 均值之差的推断
16
8.2 独立样本均值之差检验 8.2.1 等方差假设检验 8.2.2 等方差参数估计 8.2.3 不等方差假设检验 上一页 下一页
8.2 独立样本均值之差检验 等方差假设检验 等方差参数估计 不等方差假设检验 上一页 下一页 返回本章首页 第8章 均值之差的推断
17
等方差假设检验 例 某学校管理学院考虑专业设置情况,现已知会计专业与财务专业皆为社会所需求,但似乎会计专业毕业生年薪高于财务专业。 现在某地开发区随机抽取会计与财务专业的毕业生各12名,调查其参加工作第一年的年薪情况。 试以0.05显著性水平,判断会计专业毕业生的年薪是否高于财务专业毕业生的年薪。 上一页 下一页 返回本节首页 第8章 均值之差的推断
18
本题证明会计专业毕业生的年薪高于财务专业毕业生的年薪,所以是一个单侧检验。 会计专业年薪的数据是变量1,财务专业年薪的数据是变量2。
1.假设检验计算 本题证明会计专业毕业生的年薪高于财务专业毕业生的年薪,所以是一个单侧检验。 会计专业年薪的数据是变量1,财务专业年薪的数据是变量2。 差异是两个均值之差。 原假设是两个专业毕业生的年薪相同,即两个均值之差为零。 备择假设是会计专业毕业生年薪均值大于财务专业毕业生年薪均值,即两个均值之差大于零。 上一页 下一页 返回本节首页 第8章 均值之差的推断
19
①打开“第8章 均值之差推断.xls”工作簿,选择 “等方差”工作表。如下页图所示。
建立假设: 二者没有显著差别 会计专业年薪大于财务 专业年薪 ①打开“第8章 均值之差推断.xls”工作簿,选择 “等方差”工作表。如下页图所示。 上一页 下一页 返回本节首页 第8章 均值之差的推断
20
上一页 下一页 返回本节首页 第8章 均值之差的推断
21
②在“工具”菜单中选择“数据分析”选项,打开“数据 分析”对话框,选择“t检验:双样本等方差假设”, 单击”确定“按钮,打开双样本等方差分析对话框。
上一页 下一页 返回本节首页 第8章 均值之差的推断
22
⑤在“假设平均差”中输入数字“0”,选择“标志”选项,在处选择0.05,单击“输出区域”,在右边空格中输入单元格D1,单击“确定”按钮。
③在“变量1的区域”中输入“A1:A13”。 ④在“变量2的区域”中输入“B1:B13”。 ⑤在“假设平均差”中输入数字“0”,选择“标志”选项,在处选择0.05,单击“输出区域”,在右边空格中输入单元格D1,单击“确定”按钮。 上一页 下一页 返回本节首页 第8章 均值之差的推断
23
8.2.2 等方差参数估计 下述步骤描述了如何为均值间的差异确定 置信区间。 ①如下页图所示,在单元格H1中输入“95%的
等方差参数估计 下述步骤描述了如何为均值间的差异确定 置信区间。 ①如下页图所示,在单元格H1中输入“95%的 置信区间”,从单元格H4起,分别输入“观 察均值差异”,“标准误差”,“t 统计量”, “抽样极限误差”,“估计下限”和“估计上限”。 上一页 下一页 返回本节首页 第8章 均值之差的推断
24
②在单元格I4中输入公式“=E4-F4”,计算样本均值差异。 ③在单元格I5中输入公式“=(I4-E8)/E10”,计算标准误差。
上一页 下一页 返回本节首页 第8章 均值之差的推断
25
④在单元格I6中输入公式“=TINV(0.05,E9)”,计算 t 统计量。 ⑤在单元格I7中输入公式“=I6*I5”,计算抽样极限误差。
根据上页图可知,置信区间可以解释为总体均值差在161~6404元之间的概率是95% 上一页 下一页 返回本节首页 第8章 均值之差的推断
26
8.2.3 不等方差假设检验 例 某供应电脑显示器的公司正考虑采用一种 耐用时间更长的新灯泡。
不等方差假设检验 例 某供应电脑显示器的公司正考虑采用一种 耐用时间更长的新灯泡。 公司有以前灯泡样本的检验数据,也有最 近得到的新灯泡样本检验数据。 根据这些数据,该公司能够在显著性水平 为0.05的情况下认定新灯泡的平均寿命比旧 灯泡长吗? 上一页 下一页 返回本节首页 第8章 均值之差的推断
27
拒绝原假设的必要条件是新>旧,即样本均值同原来不一致。
建立假设 原假设:Ho:μ新≤μ旧 备择假设:Ha:μ新≥μ旧 拒绝原假设的必要条件是新>旧,即样本均值同原来不一致。 打开“第8章 均值之差推断.xls”工作簿,选择“异方差”工作表如图所示。 上一页 下一页 返回本节首页 第8章 均值之差的推断
28
①选择“工具”菜单的“数据分析”选项,打开数据分析对话框。 在“数据分析”对话框中选择“t检验:双样本等方差假设”选项
1. 方差相等检验 ①选择“工具”菜单的“数据分析”选项,打开数据分析对话框。 在“数据分析”对话框中选择“t检验:双样本等方差假设”选项 单击“确定”按钮,打开“t检验:双样本等方差假设”对话框如图所示。 上一页 下一页 返回本节首页 第8章 均值之差的推断
29
④在“假设平均差”中输入数字“0”,并选择“标志” 选项。
②在“变量1的区域”中输入 “A1:A23”。 ③在“变量2的区域”中输入 “B2:B13”。 ④在“假设平均差”中输入数字“0”,并选择“标志” 选项。 上一页 下一页 返回本节首页 第8章 均值之差的推断
30
⑤单击“输出区域”,在右边空格中输入单元格地址C1,单击“确定”按钮,得到结果如图所示。
上一页 下一页 返回本节首页 第8章 均值之差的推断
31
检验结果分析如下: ①输出结果的第一行给出了样本均值,旧灯泡平均耐用小时为47.5,新灯泡平均耐用小时为52.41。二者存在差异,样本与原假设不一致,可以利用P值进行判断决策。 ②单侧P值是 ,比显著性水平(0.05)稍大一点。因此不能拒绝原假设,也就是说在0.05的显著性水平下没有证据说明新灯泡比旧灯泡更耐用。 上一页 下一页 返回本节首页 第8章 均值之差的推断
32
③t单侧临界值为1.6938,略大于t统计量的绝对值,所以,不能拒绝原假设。
上面计算结果是假设两总体方差相同,二者的方差存在很大的差异,因而如果利用异方差进行检验可能会有不同的结果 上一页 下一页 返回本节首页 第8章 均值之差的推断
33
利用Excel中的“t-检验:双样本异方差假设”分析工具进行检验。
2.方差不等检验 利用Excel中的“t-检验:双样本异方差假设”分析工具进行检验。 ①在数据分析对话框中选择“t检验:双样本异方差假设”选项,打开“t检验:双样本异方差假设”对话框如图所示。 上一页 下一页 返回本节首页 第8章 均值之差的推断
34
④在“假设平均差”中输入数字“0”,并单击“标志”选项。
②在“变量1的区域”中输入 “A1:A23”。 ③在“变量2的区域”中输入 “B2:B13”。 ④在“假设平均差”中输入数字“0”,并单击“标志”选项。 ⑤单击“输出区域”,在右边空格中输入单元格地址G1,单击“确定”按钮,得到结果如图所示。 上一页 下一页 返回本节首页 第8章 均值之差的推断
35
这一输出结果和前面相似,检验结果却与前不同。在上图中,单侧P值是0. 025783329,比显著性水平0
这一输出结果和前面相似,检验结果却与前不同。在上图中,单侧P值是 ,比显著性水平0.05小,t统计量的绝对值大于t临界值,拒绝原假设,结论是在0.05的显著性水平下新灯泡明显比旧灯泡更耐用。 上一页 下一页 返回本节首页 第8章 均值之差的推断
36
8.3 两总体方差差异检验 可以设计检验如下: 原假设Ho:σ2新=σ2旧 备择假设Ha:σ2新≠σ2旧,
8.3 两总体方差差异检验 可以设计检验如下: 原假设Ho:σ2新=σ2旧 备择假设Ha:σ2新≠σ2旧, 当假设总体比较正常地服从F分布时,样本统计量在这种条件下是两个样本方差的比率。如果原假设被拒绝,就可相信总体方差是不同的,则使用两样本异方差检验的结果就是正确的。反之,则应使用两样本等方差检验。 上一页 下一页 返回本章首页 第8章 均值之差的推断
37
①打开“第8章 均值之差推断.xls”工作簿,选择 “异方差”工作表 。 ②在 “数据分析”对话框“分析工具”栏中选择“F检验:双样本方差”选项,打开“F检验:双样本方差”对话框。
上一页 下一页 返回本节首页 第8章 均值之差的推断
38
④单击“输出区域”,在右边空格中给出输出地址C30,分析结果将会以C30为输出起点。单击“确定”按钮,分析结果如下页图所示。
③在“变量1区域”中输入A1:A23。在“变量2区域”中输入B1:B13。选择“标志”选项。输入显著性水平0.05,Excel分析工具通常将0.05作为默认值。 ④单击“输出区域”,在右边空格中给出输出地址C30,分析结果将会以C30为输出起点。单击“确定”按钮,分析结果如下页图所示。 上一页 下一页 返回本节首页 第8章 均值之差的推断
39
单,从菜单中选择“插入”选项,在出现的插 入对话框中选择“活动单元格下移”选项,单 击确定“按钮。
⑤选中C39:E39,单击鼠标右键,打开快捷菜 单,从菜单中选择“插入”选项,在出现的插 入对话框中选择“活动单元格下移”选项,单 击确定“按钮。 上一页 下一页 返回本节首页 第8章 均值之差的推断
40
⑥在单元格C39中输入“双侧P值”,在D39单元格中输入公式“=D38*2”,显示的值是0.017676129。
上一页 下一页 返回本节首页 第8章 均值之差的推断
41
案例研究:美国男女收入差异检验 背景分析 根据美国劳动部女工局资料显示,1994年,美国女性劳动力约占46%,据预测到2005年可能会占48%。 这些数据表明女性是美国社会中的“半边天”。女性在为美国的经济发展中贡献近一半的力量,然而,其收入却同美国男性有着显著差别。 这里利用均值之差检验,以0.05为显著性水平,对美国男女收入差异进行检验,以判断是否存在差异。 上一页 下一页 返回本节首页 第8章 均值之差的推断
42
①打开“第8章 均值之差推断.xls”工作簿,选择“美 国男女收入”工作表
上一页 下一页 返回本节首页 第8章 均值之差的推断
43
④在“假设平均差”中输入数字“0”,单击“标志”选项。
建立假设: 男性与女性收入之间没有显著差别 男性收入大于女性收入 ②在“变量1的区域”中输入 “A1:A66”。 ③在“变量2的区域”中输入 “B2:B66”。 ④在“假设平均差”中输入数字“0”,单击“标志”选项。 ⑤单击“输出区域”,在右边空格中输入单元格地址 D2,单击“确定”按钮,得到结果如图所示。 上一页 下一页 返回本节首页 第8章 均值之差的推断
44
计算结果: 上一页 下一页 返回本节首页 第8章 均值之差的推断
45
男性周工资平均收入为625.6美元,女性为494.3美元,二者之间具有很大的差异。而且男女周工资的方差相差非常大。
从计算结果可以看出: 男性周工资平均收入为625.6美元,女性为494.3美元,二者之间具有很大的差异。而且男女周工资的方差相差非常大。 从检验结果看,t单侧临界值为1.65,t统计量为3.462,大于临界值,P值为 ,小于显著性水平0.05,说明男性与女性的收入之间存在着明显不平等的现象。 上一页 下一页 返回本节首页 第8章 均值之差的推断
46
8.4 成对样本推断 8.4.1 成对均值之差抽样分布 8.4.2 成对差异样本检验 8.4.3 用分析工具进行成对样本检验 上一页 下一页
8.4 成对样本推断 成对均值之差抽样分布 成对差异样本检验 用分析工具进行成对样本检验 上一页 下一页 返回本章首页 第8章 均值之差的推断
47
8.4.1 成对均值之差抽样分布 很多实验是以一个样本的每一变量 与另一样本的一个特定变量配对的方式进行的。
成对均值之差抽样分布 很多实验是以一个样本的每一变量 与另一样本的一个特定变量配对的方式进行的。 但对于相互不独立的两个样本,则不能直接应用上述方法。其处理方法基于以下事实:检验两个总体的均值相等的假设:μ1 = μ2,等价于检验假设Ho: μ1-μ2 =0。令d=x-y,则d~n(μ, s2)。问题可以简化为:D=0,则使用统计量: 上一页 下一页 返回本节首页 第8章 均值之差的推断
48
8.4.2 成对差异样本检验 例 某轮胎制造企业想知道一个新的橡胶配方 是否能提高胎面摩擦力,即新轮胎与旧轮 胎是否具有显著差异。
成对差异样本检验 例 某轮胎制造企业想知道一个新的橡胶配方 是否能提高胎面摩擦力,即新轮胎与旧轮 胎是否具有显著差异。 质量检查人员使用两套样本,一套是用传 统配方制造的轮胎,另一套是用新配方制 造的轮胎,两套轮胎除了在橡胶方面不同 外其他各方面均相同。 上一页 下一页 返回本节首页 第8章 均值之差的推断
49
根据所得数据,以0.05为显著性水平,制造企 业是否有足够的证据证明用新配方制造的轮胎 的平均寿命超过用原橡胶配方制造的轮胎的平 均寿命?
现随机选择6名汽车司机进行实验,每个小汽 车配两个用原橡胶配方生产的轮胎和两个用新 配方生产的轮胎,并且保证每个汽车的前轮和 后轮均装有一个新配方的轮胎和用原配方制造 的轮胎。开动汽车直到当有一轮胎破裂,对这 个轮胎的里程寿命进行登记,然后继续开这辆 车,直到所有的轮胎破裂为止,记录每个轮胎 行程里数。 根据所得数据,以0.05为显著性水平,制造企 业是否有足够的证据证明用新配方制造的轮胎 的平均寿命超过用原橡胶配方制造的轮胎的平 均寿命? 上一页 下一页 返回本节首页 第8章 均值之差的推断
50
建立假设: 原假设: Ho:μ新≤μ旧 备择假设:Ha:μ新>μ旧。
由于这种方法用于两个总体均值的推断,其所表示的假设与两个总体均值之间的差异有关,如果设Ho:μ新-μ旧=μ0=0,则原假设可转变为Ho:μ0≤0,备择假设就可转变为Ha: μ0>0 ,由于每个用传统橡胶配方制造的轮胎和用新配方制造的轮胎相对应,因此,这些样本明显成对。 上一页 下一页 返回本节首页 第8章 均值之差的推断
51
①打开“第8章 均值之差推断.xls”工作簿,选择“配对”工 作表。
上一页 下一页 返回本节首页 第8章 均值之差的推断
52
②在单元格C1中输入“离差”,在单元格C2中输入公式“=A2-B2”,其显示值为5,759。复制单元格C2中的公式到单元格区域C3:C13中。
③在单元格B14中输入“均值”,在单元格B15中输入“标准差”,在单元格B16中输入“标准误差”,在单元格B17中输入“t统计量”,在单元格B18输入“P值”。 ④在单元格C14中输入公式“=AVERAGE(C2:C13)”计算均值,在单元格C15中输入公式“=STDEV(C2:C13)”,计算标准差,分别显示结果为3092和 。 上一页 下一页 返回本节首页 第8章 均值之差的推断
53
⑤在单元格C16中输入公式“=C15/SQRT(12)”,计算标准误差。 ⑥在单元格C17中输入公式“=C14/C16” 计算t统计量。
⑦在单元格C18中输入公式“=TDIST(ABS(C17),11,1)” 计算单侧P值,显示结果为 。 由于这个P值小于显著性水平,故拒绝原假设,并得出结论:可以证明用新橡胶配方生产的所有轮胎的胎面寿命的均值超过原橡胶配方生产的轮胎寿命的均值。 上一页 下一页 返回本节首页 第8章 均值之差的推断
54
用分析工具进行 成对样本检验 除了利用Excel创建公式检验配对样本,也可利用Excel提供的配对样本检验分析工具,这个分析工具能自动地进行各种计算并得出结果。但如果发生数据改动,则需要再运行一次分析工具。 上一页 下一页 返回本节首页 第8章 均值之差的推断
55
①打开“第8章 均值之差推断.xls”工作簿,选择“配对”工 作表。
上一页 下一页 返回本节首页 第8章 均值之差的推断
56
②在“数据分析”对话框中的“分析工具”列表中选择“t检验:平均值的成对二样本分析”选项,打开对话框。
上一页 下一页 返回本节首页 第8章 均值之差的推断
57
⑦在“”区域中输入显著性水平0.05,Excel分析工具通常将0.05作为默认值。
③在“变量1区域”中输入A1:A13。 ④在“变量2区域”中输入B1:B13。 ⑤在“假设平均差”区域中输入数值“0”。 ⑥选择“标志”选项。 ⑦在“”区域中输入显著性水平0.05,Excel分析工具通常将0.05作为默认值。 ⑧单击“输出区域”,在右边空格中给出输出地址D1,分析结果将会以D1为输出起点。 上一页 下一页 返回本节首页 第8章 均值之差的推断
58
⑨单击“确定”按钮,分析结果图所示。 上一页 下一页 返回本节首页 第8章 均值之差的推断
59
结果分析: 分析工具的输出结果中给出了单侧检验和双侧检验的t临界值和P临界值。无论根据t统计量与t临界值比较进行判断,还是利用P值与显著性水平比较判断,都能得出拒绝原假设的结论。 需要说明的是分析工具给出的输出结果并没有显示原假设是否被拒绝,其判断仍需人为决定,另外,输出结果中没有包括差异和均值的标准误差,也未给出置信区间。 上一页 下一页 返回本节首页 第8章 均值之差的推断
60
Thank you very much! 谢谢! 上一页 退出 返回本章首页 第8章 均值之差的推断
Similar presentations