计数资料的统计推断 (2 学时) 吴成秋 公共卫生学院预防医学系

Slides:



Advertisements
Similar presentations
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
足太阴脾经在足大趾与足阳明胃经衔接, 在胸部与手少阴心经相接。 联系的脏腑器官有 咽、舌,属脾,络胃,注心中。 络脉从本经分出,走向足阳明经,进入腹腔,联络肠胃。 经别结于咽,贯舌本。 经筋结于髀,聚于阴器,上腹,结于脐,散于胸中。 第四章 足太阴经络与腧穴 第一节 足太阴经络.
第八章 X2 检验 卫生(医学)统计学 普通高等教育 “ 十一五 ” 国家级规划教材. X 2 检验用途 1 、推断两个或两个以上的总体率或总体构 成比 之间有无差别; 2 、推断两种属性或两个变量之间有无关联 性; 3 、频数分布的拟合优度检验。
7.1 假设检验 1. 假设检验的基本原理 2. 假设检验的相关概念 3. 假设检验的一般步骤 4. 典型例题 5. 小结.
第十七章 分类资料的统计推断.
二项分布.
103年度學生健康檢查.
2007金坛房地产市场调研报告.
小組課業 電腦在教學上的應用 Power Point 導師: 黎耀志先生.
专题三 生物圈中的绿色植物.
第十一章 真理与价值 主讲人:阎华荣.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
第五讲 抽样分布与参数估计.
完全随机设计多样本资料秩和检验.
08-09冬季学期 概率论与数理统计 姜旭峰,胡玉磊.
第 8 章 假设检验 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
Distribution and Application of Discrete Variable
第七章 固 定 资 产.
第 八 章 t 检 验.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
本讲义可在网址 或 ftp://math.shekou.com 下载
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三节 参数估计 参数估计就是用样本统计量来推算总体参数,有点估计和区间估计两种方法。 一、参数估计的理论基础
线性相关分析.
第四章 抽样误差与假设检验 要求: 掌握:均数的抽样误差与标准误,t分 布的特征,t界值表,总体均数可信区间及其与参考值范围的区别。
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 3 主讲人 陶育纯 医学统计分析 医学统计学方法.
成组设计两样本均数的比较 赵耐青 卫生统计教研室.
区间估计 Interval Estimation.
统计学期末复习
t 检验——问题提出 假设检验是通过两组或多组的样本统计量的差别或样本统计量与总体参数的差异来推断他们相应的总体参数是否相同;
营销策划技术 四川财经职业学院 工商管理系.
行政院國軍退除役官兵輔導委員會 嘉義榮民醫院.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
第十章 方差分析.
数据统计与分析 秦 猛 南京大学物理系 手机: 第十讲 数据统计与分析 秦 猛 南京大学物理系 办公室:唐仲英楼A 手机:
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习3 主讲人 陶育纯 医学统计学方法 实习3 主讲人 陶育纯 流行病与卫生统计学教研室
常用概率分布 ---Poisson分布.
第七章 参数估计 7.3 参数的区间估计.
医学统计学方法 实习3 主讲人 陶育纯 医学统计学方法 实习3 主讲人 陶育纯
公立學校教職員退休資遣撫卹條例重點說明 苗栗縣政府人事處編製 主講人:陳處長坤榮 107年5月2日.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
完全随机设计多组资料的比较 赵耐青 卫生统计教研室.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第四节 多个样本均数的两两比较 多个样本均数的两两比较又称多重比较(multiple comparison),其目的是推断究竟哪些总体均数之间存在差别。
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第八章 假设检验 8.3 两个正态总体参数的假设检验.
Sampling Error and Hypothesis Test
单样本检验.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
贝叶斯估计 Bayes Estimation
第五章 二项分布和Poisson 分布及其应用
二、配对样本t检验 配对设计(paired design)定义:将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理,称为随机配对设计。
7.3 参数的区间估计 一、区间估计基本概念 二、正态总体均值与方差的区间估计 三、小结.
假设检验.
第8章 抽样推断与参数估计.
Presentation transcript:

计数资料的统计推断 (2 学时) 吴成秋 公共卫生学院预防医学系 计数资料的统计推断 (2 学时) 吴成秋 公共卫生学院预防医学系

一、均数的抽样误差与标准误的概念 从N(,2)的总体中做随机抽样,每次抽样样本含量为n,样本均数为x,标准差为S . 如下: 1 n x1 s1 sx1 t1 2 n x2 s2 sx2 t2 3 n x3 s3 sx3 t3 4 n x4 s4 sx4 t4 … … … … … … 100 n x100 s100 sx100 t100 标准误用x表示,它是说明均数抽样误差的大小 可知:每一个样本均数与不一定相等,它们之差别是由抽样所造成的;另外,这100个样本均数大小也不尽相同,它们之间的变异程度可以用样本均数的标准差来表示,即标准误(为了与反映个体变异的标准差相区别)

二、率的抽样误差与标准误的概念 n P=(1-) 从总体率为的总体中做随机抽样,每次抽样样本含量为n,阳性例数为X,P=x/n, 如下: 1 n X1 p1 2 n X2 p2 3 n X3 P3 4 n X4 P4 … … … … 100 n X100 P100 率的标准误用P表示,它是说明率的抽样误差大小 P=(1-) 可知:每一个样本率p与不一定相等,它们之差别是由抽样所造成的;另外,这100个样本率p大小也不尽相同,它们之间的变异程度可以用样本率的标准差来表示,即标准误p n

n 标准误的计算 在实际工作中,由于是未知,由上式不能求出标准误,因此,用样本率p来估计的大小。 标准误(估计值) SP= P(1-P). n

例10-4:某研究组欲研究高中生饮酒(每周饮酒一次及以上)与父亲饮酒的关系,在某地随机抽取了1个街区家中有高中学生的父亲进行调查,258个父亲不饮酒,其子饮酒的有36人;365个父亲饮酒,其子饮酒的有129人,计算父亲饮酒与否的高中生饮酒率及其标准误。

n1=258, X1=36, P1=36/258=0.1395, 1-P1=0.8605 n2=365, X2=129, P2=129/365=0.3534, 1-P2=0. 6466 SP1=P1(1-P1) =0.1395(1-0.1395) =0.0216=2.16% SP2=P2(1-P2) =0.3534(1-0.3534) =0.025=2.50% n1 258 n2 365

三、总体率的估计 点估计(point estimation):估计总体率的具体数值大小,一般就用P代替的大小。该估计方法没有考虑抽样误差的大小,较少用。 例:某抽样得P=13.95%, =13.95%. 区间估计(interval estimation):指用P和SP按一定的概率估计总体率在哪一个范围,该区间包含总体率的概率为1-,称为总体率的1-可信区间。1-一般取0.95或0.99。

(一) 正态近似法 1.条件:要求资料服从正态分布: ①n>50, ②nP>5 和 n(1-P)>5 ③ P或(1-P)均不接近0或100% 2.估计方法 双侧:PuSP 单侧: <P+uSP 或>P-uSP

例10-4中父亲饮酒与否的高中生饮酒率的95%的可信区间。 父亲不饮酒组: PuSP=13.59%1.96×2.16%=9.7164%~18.1836% 父亲饮酒组: PuSP=35.34%1.96×2.50%=30.44%~40.24%

(二)查表法 当n较小,n≤50,特别是P或1-P接近0或1时,按二项分布原理估计总体率的可信区间。 可根据样本含量n和阳性例数 X查阅相应的可信区间估计用表。

四、率的假设检验 (一)、样本率与总体率的比较 1、直接法 :按二项分布的原理直接计算概率 一般适用于 (1)单侧性检验 (2)发生的阳性数或阴性数较少(资料不满足正态近似的条件)

累积概率的计算

2、正态近似法(u检验) 符合正态近似的条件,可用u检验

例10-5 根据大量调查资料,城镇25岁及以上者高血压患病率为11%。某研究组在某油田职工家属区随机抽查了25岁及以上者598人,82人确诊为高血压。问油田职工家属的高血压患病率与一般人有无不同?

0.11×0.89/598 解: 0=0.11, 1-0=0.89, n=598, x=82, p=82/598=0.14 H0: π=0 H1: π≠0 α=0.05 u = 0.14-0.11 =2.34 查u界值表,得P<0.05。按α=0.05水准,拒绝H0,接受H1,即该油田职工家属的高血压患病率高于一般。 0.11×0.89/598

Sp1-p2=Pc(1-Pc)(1/n1+1/n2) (二)两样本率的u比较 已知;P1 推导 : π1 P2 π2 如果 n1 , n2均较大,大于50;且 p1、1-p1及p2、1-p2均不太小;n1p1、n1(1-p1) 及 n2 p2 、n2(1-p2)均大于5。 可用u检验 u=p1-p2 Pc=X1+X2 Sp1-p2 n1+n2 Sp1-p2=Pc(1-Pc)(1/n1+1/n2)

例6-5为研究某职业人群颈椎病发病的性别差异,今随机抽查了该职业人群男性120人和女性110人,发现男性中有36人患有颈椎病,女性中有22人患有颈椎病。试作统计推断。

已知 P1 ≠ P2 推导 : π1 ≠ π2 H0: π1= π2 H1: π1≠ π2 α=0.05 本例n1=120, x1=36, p1=x1/n1=36/120=0.30 n2=110, x2=22, p2=x2/n2=22/110=0.20 u=(0.30-0.20)/0.0573=1.745 查u界值表得0.05<P<0.10。按α=0.05水准,不拒绝H0,尚不能认为该职业人群颈椎病的发病有性别差异。

例10-6 利用例10-4的资料,比较父亲饮酒与不饮酒组高中生饮酒率有无差别? 例10-6 利用例10-4的资料,比较父亲饮酒与不饮酒组高中生饮酒率有无差别? n1=258, X1=36, P1=36/258=0.1395, 1-P1=0.8605 n2=365, X2=129, P2=129/365=0.3534, 1-P2=0. 6466 Pc=X1+X2 = 36 + 129 =0.2648, 1-Pc =0.7352 n1+n2 258+365

H0: π1= π2 H1: π1≠ π2 α=0.05 Sp1-p2= Pc(1-Pc)(1/n1+1/n2) = 0.2648.07352.(1/258+1/365)=0.03589 u=(0.3534-0.1395)/0.03589=5.96 查u界值表得P<0.01。按α=0.05水准,拒绝H0,认为父亲饮酒率高,其子女饮酒率也高。