第三篇医学统计学方法. 第三篇医学统计学方法医学统计学方法 3 主讲人陶育纯医学统计分析医学统计学方法.

Slides:

Advertisements

Similar presentations

第五节函数的微分一、微分的定义二、微分的几何意义三、基本初等函数的微分公式与微分运算法则四、微分形式不变性五、微分在近似计算中的应用六、小结.

Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.

2.5 函数的微分一、问题的提出二、微分的定义三、可微的条件四、微分的几何意义五、微分的求法六、小结.

第二章导数与微分. 二、微分的几何意义三、微分在近似计算中的应用一、微分的定义 2.3 微分.

第二节换元积分法一、第一类换元积分法（凑微分法）二、第二类换元积分法. 问题解决方法利用复合函数，设置中间变量. 过程令一、第一类换元积分法（凑微分法）

全微分教学目的：全微分的有关概念和意义教学重点：全微分的计算和应用教学难点：全微分应用于近似计算.

第三节微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出实例 : 正方形金属薄片受热后面积的改变量.

7.1 假设检验 1. 假设检验的基本原理 2. 假设检验的相关概念 3. 假设检验的一般步骤 4. 典型例题 5. 小结.

第十七章分类资料的统计推断.

第四章概率、正态分布、常用统计分布.

第三章函数逼近 — 最佳平方逼近.

第六章假设检验基础.

6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.

完全随机设计多样本资料秩和检验.

第 8 章假设检验作者：中国人民大学统计学院贾俊平 PowerPoint 统计学.

计数资料的统计推断（2 学时）吴成秋公共卫生学院预防医学系

四种命题 2 垂直.

第八章 t 检验.

第五节微积分基本公式、变速直线运动中位置函数与速度函数的联系二、积分上限函数及其导数三、牛顿—莱布尼茨公式.

一、原函数与不定积分二、不定积分的几何意义三、基本积分公式及积分法则四、牛顿—莱布尼兹公式五、小结

第二节微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.

第三篇医学统计学方法. 第三篇医学统计学方法医学统计学方法实习2 主讲人陶育纯医学统计学方法实习2 主讲人陶育纯流行病与卫生统计学教研室

本讲义可在网址或 ftp://math.shekou.com 下载

不确定度的传递与合成间接测量结果不确定度的评估

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

2-7、函数的微分教学要求教学要点.

§5 微分及其应用一、微分的概念实例:正方形金属薄片受热后面积的改变量..

第四章抽样误差与假设检验要求：掌握：均数的抽样误差与标准误，t分布的特征，t界值表，总体均数可信区间及其与参考值范围的区别。

成组设计两样本均数的比较赵耐青卫生统计教研室.

区间估计 Interval Estimation.

t 检验——问题提出假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同；

Business Statistics Topic 6

第6章统计量及其抽样分布统计量关于分布的几个概念由正态分布导出的几个重要分布样本均值的分布与中心极限定理样本比例的抽样分布

第三章多维随机变量及其分布 §2 边缘分布边缘分布函数边缘分布律边缘概率密度.

第十章方差分析.

数据统计与分析秦猛南京大学物理系手机：第十讲数据统计与分析秦猛南京大学物理系办公室：唐仲英楼A 手机：

第三篇医学统计学方法. 第三篇医学统计学方法医学统计学方法实习3 主讲人陶育纯医学统计学方法实习3 主讲人陶育纯流行病与卫生统计学教研室

第七章参数估计 7.3 参数的区间估计.

医学统计学方法实习3 主讲人陶育纯医学统计学方法实习3 主讲人陶育纯

第一章函数与极限.

习题一、概率论 1.已知随机事件A，B，C满足在下列三种情况下，计算（1）A，B，C相互独立（2）A，B独立，A，C互不相容

抽样和抽样分布基本计算 Sampling & Sampling distribution

3.8.1 代数法计算终点误差终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差

模型分类问题 Presented by 刘婷婷苏琬琳.

概率统计主讲教师叶宏山东大学数学院.

5.2 常用统计分布一、常见分布二、概率分布的分位数三、小结.

完全随机设计多组资料的比较赵耐青卫生统计教研室.

成绩是怎么算出来的？ 16级第一学期半期考试成绩班级姓名语文数学英语政治历史地理物理化学生物总分 1 张三1 115

§6.7 子空间的直和一、直和的定义二、直和的判定三、多个子空间的直和.

相关与回归非确定关系在宏观上存在关系，但并未精确到可以用函数关系来表达。青少年身高与年龄，体重与体表面积非确定关系：

一测定气体分子速率分布的实验实验装置金属蒸汽显示屏狭缝接抽气泵.

概率统计主讲教师叶宏山东大学数学院.

第4课时绝对值.

第一部分：概率产生随机样本：对分布采样均匀分布其他分布伪随机数很多统计软件包中都有此工具如在Matlab中：rand

第四节多个样本均数的两两比较多个样本均数的两两比较又称多重比较(multiple comparison)，其目的是推断究竟哪些总体均数之间存在差别。

分数再认识三真假带分数的练习课.

§5.2 抽样分布　　确定统计量的分布——抽样分布，是数理统计的基本问题之一．采用求随机向量的函数的分布的方法可得到抽样分布．由于样本容量一般不止2或 3(甚至还可能是随机的)，故计算往往很复杂，有时还需要特殊技巧或特殊工具．　　由于正态总体是最常见的总体，故本节介绍的几个抽样分布均对正态总体而言．

概率论与数理统计B.

第二节函数的极限一、函数极限的定义二、函数极限的性质三、小结思考题.

第三节随机区组设计的方差分析随机区组设计资料的总平方和可以分解为三项：（10.10）.

欢迎大家来到我们的课堂 §3.1.1两角差的余弦公式广州市西关外国语学校高一(5)班教师：王琦.

第十五讲区间估计本次课讲完区间估计并开始讲授假设检验部分下次课结束假设检验，并进行全书复习本次课程后完成作业的后两部分

第八章假设检验 8.3 两个正态总体参数的假设检验.

Sampling Error and Hypothesis Test

单样本检验.

第三章从概率分布函数的抽样 (Sampling from Probability Distribution Functions)

二、配对样本t检验配对设计(paired design)定义:将受试对象按某些重要特征相近的原则配成对子，每对中的两个个体随机地给予两种处理，称为随机配对设计。

一元一次方程的解法(－).

Presentation transcript:

第三篇医学统计学方法

医学统计学方法 3 主讲人陶育纯 http://cc.jlu.edu.cn/ss.html 医学统计分析 http://cc.jlu.edu.cn/ss.html http://cc.jlu.edu.cn/ms.html 医学统计学方法 3 主讲人陶育纯流行病与卫生统计学教研室 2013.11.11 教案

第四讲课程名称：预防医学主要教材： «卫生学» 第7版仲来福主编人民卫生出版社年级、专业：2011级医学五年制第一教班仲来福主编人民卫生出版社年级、专业：2011级医学五年制第一教班授课时间：2013年11月11日授课时数：4h 2013.11.11

目录第九章数值变量资料的统计分析（续）第三节数值变量资料的统计推断一、均数的抽样误差与标准误二、t 分布三、总体均数置信区间的估计四、假设检验的基本思想和步骤 2013.11.11

第四节 t 检验和 u 检验一、样本均数与总体均数的比较二、配对资料的比较三、两个样本均数的比较四、假设检验应注意的问题 2013.11.11

第三节数值变量资料的统计推断第九章数值变量资料的统计分析（续）一、均数的抽样误差与标准误㈠均数的抽样误差由于总体常常不能直接研究，因此从总体中随机抽取一定数量的观测值作为样本进行抽样研究（sampling study）成为统计研究的最基本的方法。变异的存在使得样本指标与总体指标不一定恰恰相等。这种由抽样造成的统计量与总体参数的差异叫抽样误差。抽样误差是不可避免的。 2013.11.11

研究抽样误差的大小的变化规律对于由样本指标推断总体指标非常有意义。统计学基础理论的中心极限定理指出: ㈡标准误研究抽样误差的大小的变化规律对于由样本指标推断总体指标非常有意义。统计学基础理论的中心极限定理指出: ① 从正态分布总体N(μ,σ2)中随机抽取容量为n的样本，其样本均数服从正态分布。其中可按下式计算：式(9-18) ② 如果一个变量的总体分布具有均数μ和标准差σ，则从该总体抽得的容量为n的样本， 2013.11.11

在n趋于无穷大时，样本均数的分布趋向正态分布。定理的直观表述见下图。 x总体总体 n x1 样本1 x4 xi-2 n x2 xi 样本2 . . . x3 xi-1 ... ... ... ... ... n 样本j 2013.11.11

为了理解中心极限定理，特用一个模拟实验例子来说明。通过计算这100个样本均数的均数和标准差，来了解均数的抽样误差的变化规律。例某地假定1979年成都市16岁女学生的身高服从均数为155.4 cm、标准差为5.3cm的正态分布。用电子计算机做抽样模拟实验，从 N(155.4,5.32)的总体中，每次随机抽出10个数字(即样本含量n=10)，组成一个样本，求出样本均数及标准差S。例如1号样本的10数字为： 154.4 151.6 159.2 145.5 152.2 150.6 158.6 151.9 157.1 由此求得，S1=4.15。仿此方式抽取100次，每次均抽出10个数字，可求得100个样本均数及标准差，具体见表1。通过计算这100个样本均数的均数和标准差，来了解均数的抽样误差的变化规律。 2013.11.11

表1 100个样本均数、标准差( =155.4cm,  =5.3cm的模拟抽样实验) 2013.11.11

求得此100个样本均数的均数及样本均数的标准差(称标准误)为：由中心极限定理可知：①样本均数的总体均数等于μ。本实验求得此100个样本均数的均数为 155.38，而μ= 155.4，二者非常相近。②标准误按式(9-18)计算，。本实验求得的标准误为1.71，二者也很相近。 2013.11.11

如果增大抽样次数，求得的均数与标准误将更加接近理论值。再把上述实验求得的100个样本均数编制成频数表(见表2)，并绘制成直方图(见图1)，可以看到此频数分布近似正态分布；如果增大抽样次数，频数分布将更加逼近正态分布。当抽样次数趋近无穷大时，此抽样（即样本含量n=10）所得到的样本均数的分布服从总体均数也为μ，总体标准误为的正态分布（即）。 2013.11.11

表2 100个样本均数的频数表图1 100个样本均数的直方图下面的流程图将演示此模拟实验的全过程。 2013.11.11

n=10 156.51 样本1 身高总体样本 153.29 n= 10 样本2 152.46 157.11 ... ... ... ... ... ... 155.68 . . . 样本100 n= 10 157.42 求样本均数标准差 2013.11.11

编制频数表绘直方图抽样次数增大抽样次数  2013.11.11

统计量的标准差称标准误（standard error）。标准误是说明抽样误差大小的指标。标准误越大，则抽样误差越大。均数的标准差则称均数的标准误。在实际工作中，总体标准差σ常常未知，而用样本标准差S来估计，由此得到下式：式(9-19) 利用标准误可以表示抽样误差的大小，可确定总体均数的置信区间，可用于假设检验。 2013.11.11

二、t 分布㈠ t 分布的概念下述变换（标准化）：得到的变量u服从标准正态分布N( 0，1)。由中心极限定理可知，服从正态分布若变量x服从正态分布N(μ,σ2)，那么通过下述变换（标准化）：得到的变量u服从标准正态分布N( 0，1)。由中心极限定理可知，服从正态分布，通过标准化即下述变换： 2013.11.11

得到的变量u也服从标准正态分布N( 0，1)。在实际应用中，总体标准差σ常常未知，而用样本标准差S来估计，由此得到下述变换：得到的变量t则服从t分布( t-distribution)。㈡ t 分布的图形利用t分布的概率密度函数 f(t) ，可绘制t分布曲线，见下图2。 2013.11.11

图2 t 分布曲线 t分布曲线形态类似正态分布曲线。 2013.11.11

② t分布具有一个参数ν(称自由度，ν=n-1)。 ν越小，曲线越扁平；ν越大，曲线越接近标准正态分布；当ν→ ∞时，t 分布趋近于标准正态分布。 t分布是一簇曲线。不同ν的t分布曲线见图9-7。 t分布渐近标准正态分布的动态演示见。 ③ t分布曲线下面积分布有一定规律。 2013.11.11

㈣ t 分布曲线下面积分布规律（即t界值表）通过对t分布概率密度函数 f(t)求积分可以得到t分布曲线下一定区间的面积（概率）。为便于研究与应用，统计学家制作了专门的t界值表(见 302页表9-9)。t 界值常记为。其中ν为自由度，α为概率。其意义为：单侧概率：P(t≤-tα,ν)=α或P(t≥tα,ν)=α 双侧概率：P(t≤-tα/2,ν)+P(t≥tα/2,ν)=α 对于双侧概率意义的图形直观表达见下图3和图4。 2013.11.11

t(ν) 图3 t 分布曲线下面积分布示意 2013.11.11

t(ν) 图4 t 分布曲线下单侧面积分布示意 2013.11.11

三、总体均数置信区间的估计点估计参数估计统计推断区间估计假设检验点估计就是用样本指标代表总体指标。由于 (point estimation) 参数估计统计推断区间估计 (interval estimation) 假设检验点估计就是用样本指标代表总体指标。由于不能考虑抽样误差的大小，故很少用。区间估计是按一定的概率（置信度）由样本 2013.11.11

指标估计总体指标的可能范围。该范围常称某参数的置信区间或可信区间(confidence interval,CI)。置信度=1-α，常取95%或99%。总体均数的置信区间可用下述通式求得：式(9-22) 式中tα,ν为t界值，=1-置信度，ν=n－1。tα,ν值可从教材302页表9-9查得。当样本例数n足够大（n＞50）时，可用下述近似式求得：式(9-23) 2013.11.11

本（n＞50）时用，后者则大小样本都可。本例n=102>50，用式(9-23)求：式(9-23)是式(9-22)的近似式，前者只能在大样本（n＞50）时用，后者则大小样本都可。例9-13a 已知102名健康女大学生口腔温度均数 37.06 （℃），标准差S=0.198（℃），试估计该地健康女大学生口腔温度的总体均数。本例n=102>50，用式(9-23)求： 95%CI ：37.06±1.96×0.0196 → （37.02，37.10） 99%CI ：37.06±2.58×0.0196 → （37.01，37.11）该地健康女大学生口腔温度总体均数的95%置信区间为(37.02，37.10)℃ 。 2013.11.11

根据资料可知，n=20<50，只能用式(9-22)求：例9-13 随机抽取某地健康男子20人，测得该样本的收缩压均数为118.4mmHg，标准差为10.8mmHg.试估计该地健康男子收缩压总体均数的95%置信区间。根据资料可知，n=20<50，只能用式(9-22)求： ν=n－1=19，查t界值表， t0.05/2,19=2.093， 95%CI ：118.4±2.093×2.415 → （113.3，123.5）该地健康男子收缩压总体均数的95%置信区间为(113.3，123.5)mmHg 。 2013.11.11

四、假设检验的基本思想和步骤㈠假设检验的思维逻辑假设检验(hypothesis testing)是统计推断中另一类非常重要的方法,是统计学中应用最广泛的方法,其意义和思维逻辑可通过下面的例题说明。例6-1a 根据大量调查，已知正常成年男子脉搏均数为72次/分。某医生在一山区随机抽查了25名健康成年男子，求得其脉搏均数为74.2次/分，标准差为6.0次/分。能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数？ 2013.11.11

在本例中，山区成年男子脉搏均数用μ山表示，一般成年男子脉搏均数用μ0表示。 μ山= ？ μ0=72次/分 n=25 一般总体山区总体 2013.11.11

μ山＞μ0 μ山＜μ0 这里μ山与μ0的关系只能有两种： ① μ山＝μ0 ② μ山≠μ0 这里根据专业知识，μ山≠μ0的关系中只能是 μ山＞μ0 。造成二种情况的原因有： ① μ山＝μ0 （同一总体）→ 抽样误差 ② μ山≠μ0 （不同总体）→ 本质不同 2013.11.11

㈡假设检验的基本步骤 ⑴ 建立检验假设和确定检验水准检验假设有两种： ① 检验假设(hypothesis under test)又称零/原假设(null hypothesis)。用H0表示。假定通常为：某两个（或多个）总体参数相等，或某两个总体参数之差等于0，或某资料服从某一特定分布（正态分布、Poisson分布）等。本例则为：H0: μ山＝μ0 。 2013.11.11

② 备择假设(alternative hypothesis)又称对立假设。用H1表示。H1与H0对立。H1的内容可即为单侧检验(one-sided test)或单尾检验(one- tailed test)。若H1: μ山≠μ0 则为双侧检验 (two-sided test)或双尾检验(two-tailed test)。单双侧的选择在检验之前由专业知识确定。 ③ 检验水准(size of a test)是假设检验作判断结论的标准，是预先确定的概率值，常常取小概率事件标准。用α表示。也为I型错误 2013.11.11

的概率大小(详后)。实际工作中，α常取0.05。 ⑵ 选定检验方法和计算检验统计量应根据变量或资料的类型、分析的目的、设计的方案、检验方法的适用条件等选择检验方法。检验统计量(test statistic)是在H0假设的条件下由统计学家推导出的可由样本指标计算出来用于推断结论的数值。检验方法常用检验统计量的名称命名。如t 检验中的t 统计量、 u 检验中的u 统计量、χ2检验中的χ2统计量等。 2013.11.11

抽得等于及大于（或等于及小于）现有样本获得的检验统计量的概率。通俗地讲，P值就代表了H0成立与否的概率。推断结论应包含统计结论和专业结论两部分。若P ≤α，则按α检验水准拒绝H0，有统计学意义（统计结论），可认为……不同或不等（专业结论）。 2013.11.11

若P ＞α，则按α检验水准尚不拒绝H0，无统计学意义，还不能认为……不同或不等。下面通过例6-1a具体介绍假设检验的过程：单侧，α= 0.05 2013.11.11

H0，有统计学意义。可认为该山区成年男子脉搏数高于一般成年男子脉搏数。 Why ??? Answer is on next page ! ν=24，查单侧tα,ν= t0.05,24=1.711，今求得 t =1.833＞1.711， P＜0.05，按α=0.05水准拒绝 H0，有统计学意义。可认为该山区成年男子脉搏数高于一般成年男子脉搏数。上述例6-1a属于单样本t检验，其假设检验的推断结果是依据t分布的原理作出的。为了理解其推断过程的原理，通过直观的示意图(见下图6-1a)表达上述例题假设检验的过程。 2013.11.11

H0: μ山＝μ0 μ山＝μ0 μ山＞μ0 P ＜0.05 α=0.05 α=0.05 P 单侧tα,ν= t0.05,24 t=1.833 ν=24 α=0.05 α=0.05 P 单侧tα,ν= t0.05,24 t=1.833 μ山＝μ0 μ山＞μ0 1.711 接受域拒绝域图6-1a 2013.11.11

下面列出其具体的假设检验过程： H0: μ＝μ0 =140.0g/L H1: μ≠μ0 =140.0g/L α= 0.05 例6-1b 某地抽样调查了280名健康成年男性的血红蛋白含量，其均数为136.0g/L，标准差为6.0g/L。已知正常成年男性的血红蛋白的均数为140.0g/L。试问能否认为该地所有健康成年男性的血红蛋白含量与正常成年男性的血红蛋白含量的均数不同？下面列出其具体的假设检验过程： H0: μ＝μ0 =140.0g/L H1: μ≠μ0 =140.0g/L α= 0.05 2013.11.11

H0，有统计学意义。可认为该地所有健康成年男性的血红蛋白含量与正常成年男性的血红蛋白含量的均数不同。 ν=279，查tα/2,ν= t0.05/2,279=1.969，今求得 t =11.16＞1.969， P＜0.05，按α=0.05水准拒绝 H0，有统计学意义。可认为该地所有健康成年男性的血红蛋白含量与正常成年男性的血红蛋白含量的均数不同。若查表，自由度可取比279小的最接近的200，即t0.05/2,200=1.972。上述例6-1b属于双样本t 检验，其假设检验的推断结果是依据t分布的原理作出的。为了理解其推断过程的原理,通过直观的示意图(见下图6-1b)表达上述例题假设检验的过程。 2013.11.11

H0: μ＝μ0 μ＜μ0 μ＝μ0 μ＞μ0 α=0.05 α=0.05 P P ＜0.05 t=-11.16 t=11.16 ν=279 α=0.05 α=0.05 P P ＜0.05 t=-11.16 双侧tα,ν= t0.05/2,279 t=11.16 μ＜μ0 μ＝μ0 μ＞μ0 -1.969 1.969 拒绝域接受域拒绝域图6-1b 2013.11.11

第四节 t 检验和u检验 t 检验(t-test,亦称Student’s t-test)和u 检验( u-test),二者都是用于定量资料的假设检验的方法。都可用于两组之内的样本均数与总体均数或样本均数之间的比较，目的在于推断样本均数所代表的未知总体均数与已知的总体均数或两个样本均数所代表的未知总体均数之间的差别。 t 检验的应用条件：理论上要求样本来自正态分布总体，两个样本均数比较时还要求两样本的总体方差相等，即方差齐性(homogeneity)。 2013.11.11

一、一组样本资料的t 检验 u 检验的应用条件：样本较大( n＞50 )，或 n虽小但总体标准差已知（少见）。式(9-24a) 例题见教材的例9-15 。（略） 2013.11.11

二、配对设计资料的t 检验配对t 检验：用于配对设计的定量资料的样本均数比较。配对设计主要有两种：同种处理的前后同源配对配对设计两种不同的处理异源配对用于推断两种处理或处理前后的结果有无差别。利用两种处理或处理前后的差值d的样本均数所代表的未知总体均数μd 与已知的总体均数 2013.11.11

μ0=0的比较。其检验统计量的计算公式为：式(9-24) 式中d为每对数据的差值，为差值的样本均数，Sd 为差值的标准差，为差值样本均数的标准误，n为对子数。例6-2a 某护师随机抽取10名健康女大学生，在午饭后休息1小时，测试口腔温度，体温表分别在口腔中放置4分钟和7分钟，测试结果见表6-2a。试比较两种放置时间测试结果是否相同？本试验属于同源配对中两种不同的处理的比较。 2013.11.11

2013.11.11

H0: μd＝μ0=0 H1: μd ≠μ0 ≠0 α= 0.05 2013.11.11

ν=n-1=10-1=9，查双侧tα/2,ν= t0.05/2,9=2.262，今求得 t =5.45＞2.262 ，P＜0.05，按α=0.05水准拒绝H0，有统计学意义。可认为测试时间长短对测试结果有影响，7分钟测试结果高于4分钟。本题的计算可利用计算器的统计功能简化计算过程，把10个差值d作为原始数据输入计算器中，可直接得到和Sd 。教材的例9-16（自学）。 2013.11.11

三、1. 两组独立样本资料的t 检验两样本t 检验亦称成组t 检验。用于完全随机设计的定量资料的两样本均数的比较，目的是推断两样本均数各自所代表的总体均数μ1和μ2是否相等。完全随机设计是指分别从两研究总体中随机抽取样本，然后比较两组的总体指标。当两样本的总体方差相等（即方差齐）时，其检验统计量的计算公式为： 2013.11.11

合并方差， S1、S2、n1 、n2分别为两样本的均数、标准差、样本含量。式(9-26、9-27、9-28) 式中为两样本均数之差的标准误，为两样本合并方差， S1、S2、n1 、n2分别为两样本的均数、标准差、样本含量。例6-4a 某护师在15:00~16:00点间测得20名健康成年人的口腔温度，得：，又测得21名成年甲亢患者的口腔温度，得：。问甲亢患者的口腔温度是否与健康人不同？本试验属于完全随机设计的两样本均数的比较。由于 S1与S2非常接近，故可认为满足方差齐性，可选用上述式(9-26、9-27、9-28)进行假设检验。 2013.11.11

H0: μ1＝μ2 H1: μ1≠μ2 α= 0.05 2013.11.11

上述式(9-26)只适用于满足方差齐性的两样本t检验，若方差不齐时，可采用近似t检验（亦称检验）或后述的秩和检验。 ν=n1+n2-2=20+21-2=39 ，查双侧 t0.05/2,39≈ t0.05/2,30= 2.042，今求得 t =2.5959＞2.042 ， P＜ 0.05 ，按α=0.05水准拒绝H0，有统计学意义。可认为甲亢患者的口腔温度高于健康人。上述式(9-26)只适用于满足方差齐性的两样本t检验，若方差不齐时，可采用近似t检验（亦称检验）或后述的秩和检验。 2013.11.11

*三、2. 两组独立样本资料的t’ 检验 Satterthwaite法。用于方差不齐的完全随机设计的定量资料的两样本均数的比较，目的是推断两个样本均数各自所代表的总体均数μ1和μ2是否相等。完全随机设计是指分别从两研究总体中随机抽取样本，然后比较两组的总体指标。其检验统计量的计算公式为：式(9-28a) 式(9-28b) 2013.11.11

H0: μ1＝μ2 H1: μ1≠μ2 α= 0.05 例6-5a 经硫酸氧钒治疗的大鼠与未治疗大鼠的血糖含量比较。已知DV组12只，血糖含量(mmol/L) ；D组8只，。问两组的血糖含量的总体均数是否不同？本试验属于完全随机设计的两样本均数的比较。由于 S1与S2相差较大，故先做方差齐性检验，结果参见下述计算。由于结论为方差不齐，故选用t’ 检验。 H0: α= 0.05 H0: μ1＝μ2 H1: H1: μ1≠μ2 α= 0.05 附表9-12a 查得F0.05/2(7, 11)=3.76，今求得F=9.87＞3.76，P < 0.05，方差不齐。 2013.11.11

查表9-9（t界值表），得t0.05/2,8=2.306，知P<0.05, 在α=0.05水平上拒绝H0。所以可认为经硫酸氧钒治疗的大鼠与未治疗大鼠的血糖含量不同。 2013.11.11

*三、3. 两组独立样本资料的方差齐性检验该方法用于推断两组独立正态随机样本所代表的总体方差是否齐同，是检验两样本t检验是否满足方差齐性条件的方法之一。例6-6a 某护师在15:00~16:00点间测得20名健康成年人的口腔温度，得：，又测得21名成年甲亢患者的口腔温度，得：。问甲亢患者的口腔温度的总体方差是否与健康人相同？ 2013.11.11

在本例中，健康成年人总体方差用表示，成年甲亢患者总体方差用表示。在本例中，健康成年人总体方差用表示，成年甲亢患者总体方差用表示。 H0: H1: α= 0.05 式(9-28c) 2013.11.11

ν1为分子自由度，ν2为分母自由度，可从教材的附表9-12a查得。当α=0.05，ν1=9，ν2=27，其此界值的意义见下面的图形： F界值常用表示，其中α为检验水准； ν1为分子自由度，ν2为分母自由度，可从教材的附表9-12a查得。当α=0.05，ν1=9，ν2=27，其此界值的意义见下面的图形： 2013.11.11

H0: H1: α= 0.05 表9-12a 查得F0.05/2(19, 20)≈2.46，今求得F=1.11< 2.46，P ＞0.05，按α=0.05水准尚不拒绝H0，可认为有二者的总体方差相等，即满足方差齐性条件。See the picture on next page. 2013.11.11

2013.11.11

u 检验 1. 单样本u 检验常用于一组大样本(n＞50)定量资料的样本均数代表未知的总体均数μ和已知的总体均数μ0 (一般为理论值、标准值或经大量观察所得的稳定值)进行比较。其检验统计量的计算公式为：式(9-25a) 2013.11.11

上述式(9-25a)实际上是当n＞50时，单样本t检验的式(9-24a)的近似式。当σ已知时，只把式(9-25a)中的换成即可，但此公式很少用。例6-1c 为了解医学生的心理健康问题，随机抽取了某医科大学在校生208名，用SCL-90量表进行了测定，算得因子总分的均数为144.9，标准差为35.82。现已知全国因子总分的均数(常模)为130，问该医科大学在校生的因子总分是否与全国水平相同？本研究的样本例数n=208＞50，属于大样本；因子总分属于定量变量；又已知一个总体指标130。故本题可用单样本u检验。 2013.11.11

查u界值表(即表9-9 t界值表中ν=∞一行)， uα/2= u0.05/2=1.96，今求得 u =5.999＞1.96 ，P＜ H0: μ＝μ0=130 H1: μ ≠μ0 ≠130 α= 0.05 查u界值表(即表9-9 t界值表中ν=∞一行)， uα/2= u0.05/2=1.96，今求得 u =5.999＞1.96 ，P＜ 0.05，按α=0.05水准拒绝H0，有统计学意义。可认为该医科大学在校生的因子总分与全国水平不同。 2013.11.11

P＜0.05，按α=0.05水准也拒绝H0。二者所得结论完全一样。本题若查专业t界值表，ν=208-1=207，查双侧tα/2,ν= t0.05/2,207 =1.971，今求得t =5.999＞1.971 ， P＜0.05，按α=0.05水准也拒绝H0。二者所得结论完全一样。 2. 两大样本u 检验用于两大样本(n1、n2均＞50)的定量资料的两样本均数的比较，目的是推断两样本均数各自所代表的总体均数μ1和μ2是否相等。其检验统计量的计算公式为： 2013.11.11

上述式(9-25)实际上是当n1、n2均＞50时，两样本t 检验的式(9-26)的近似式。式中为两样本均数之差的标准误， S1、S2、n1 、n2分别为两样本的均数、标准差、样本含量。上述式(9-25)实际上是当n1、n2均＞50时，两样本t 检验的式(9-26)的近似式。例6-4b 某社区护师在该地随机抽查了25~35岁健康人群的红细胞数，其中男性150人，得均数4.623(×1012/L)，标准差0.571 (× 1012/L)；女性120人，得均数4.211(×1012/L)，标准差0.385 (×1012/L)。问该地健康人群红细胞数有无性别差异？ 2013.11.11

H0: μ1＝μ2 H1: μ1≠μ2 α= 0.05 本题属于来自两个不同总体的两样本均数的比较。由于n1=150与n2=120均大于50，故可用两大样本u检验。 H0: μ1＝μ2 H1: μ1≠μ2 α= 0.05 2013.11.11

已知双侧 u0. 05/2=1. 96，今求得 u =7. 057＞ 1. 96 ， P＜0. 05 ，按α=0 已知双侧 u0.05/2=1.96，今求得 u =7.057＞ 1.96 ， P＜0.05 ，按α=0.05水准拒绝H0，有统计学意义。可认为该地健康人群红细胞数有性别差异，男性高于女性。本题若按两样本t检验求，得t为： 2013.11.11

查专业t界值表，ν=n1+n2-2=150+120-2=268，查双侧tα/2,ν= t0.05/2,268 =1.969，今求得t =6.767 > 1.969, P＜0.05，按α=0.05水准也拒绝H0。二者所得结论完全一样。告诉你一个事实：统计软件中只有t检验，没有u检验。想想 why ? 2013.11.11

四、假设检验应注意的问题 1. 要有合理、严密的科研设计这是假设检验的前提。如组间应具有可比性；保证样本的随机抽取；确定合理的样本含量等等。 2. 正确选用假设检验方法应根据分析的目的、资料的类型和分布特点、研究设计的方法、样本含量的大小等选用适当的检验方法。需要熟悉每种假设检验方法的适用条件及该方法的特点。 3. 合理选用单双侧检验应根据分析的要求，结合专业知识确定假设检验的单双侧，应在假设 2013.11.11

statistically significant at 0.01 level 检验之前确定。一般取双侧检验较为稳妥。 4. 正确理解差别的统计学意义差别有统计学意义(statistically significant)常指P≤0.05的结论称谓，差别有高度统计学意义常指P≤0.01的结论称谓，二者均代表的是假设检验的推断结论的概率大小，而不代表推断结论中的总体指标的差别大小。有统计学意义不等于有专业意义或临床意义，统计结论必须和专业结论结合起来，才能得出符合客观实际的最终结论。 statistically significant at 0.01 level 2013.11.11

依概率大小作出的，不可能百分之百的正确，应避免使用诸如“肯定”、“一定”、“绝对”等词语下结论。 5. 统计结论不能绝对化假设检验的结论是依概率大小作出的，不可能百分之百的正确，应避免使用诸如“肯定”、“一定”、“绝对”等词语下结论。 6. 统计结论的错误性既然假设检验的结论是依概率大小作出的，不论做出什么结论，都有可能犯错误。假设检验的统计结论有可能犯两种错误，一旦做出结论，则只犯一种。 Why ??? 2013.11.11

* 假设检验的功效一、假设检验的两类错误 I 型错误（type I error）：拒绝了实际上是成由于假设检验的推断结论是以概率作为保证的，因此无论是拒绝H0还是接受H0，都有可能发生以下两种错误之一，即I 型错误和II 型错误。 I 型错误（type I error）：拒绝了实际上是成立的H0。亦称“弃真”错误。其概率大小用α表示，和检验水准一致，也是小概率事件的标准。 II 型错误（type II error）：接受了实际上是不成立的H0。亦称“存伪”错误。其概率大小用β 2013.11.11

当n固定时，α愈小，β愈大；反之α愈大，β愈小。若要同时减小α与β，唯一的办法是增加样本含量。表示。其概率大小很难确切估计。当n固定时，α愈小，β愈大；反之α愈大，β愈小。若要同时减小α与β，唯一的办法是增加样本含量。为了更好地理解两型错误的原理及相互关系，以单侧z检验为例，用一个示意图（见图6-4和图6 -4a）来说明。 2013.11.11

图6-4 2013.11.11

图6-4a 2013.11.11

二、假设检验的功效 1-β称为检验功效（power of a test）,亦称检验效能。其意义是当两总体确有差异，按α检验水准所能发现该差异（拒绝H0）的能力。如果1 -β=0.90，则意味着当H0不成立时，理论上在每100次抽样中，在α的检验水准上平均有90次能拒绝H0 。一般情况下对同一检验水准α, 功效大的检验方法更可取。 C 2013.11.11

ν= ∞(标准正态曲线) f(t) ν= 4 ν= 1 图9-7 自由度分别为1、4、∞的t分布曲线 2013.11.11

图中红色曲线为标准正态曲线，兰色曲线为t 分布曲线， df 为自由度。 2013.11.11