第十一章 两变量关联性分析.

Slides:



Advertisements
Similar presentations
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
第 4 章 数值微积分. 4.1 内插求积 Newton-Cotes 公式 第 4 章 数值微积分 4.1 内插求积 Newton-Cotes 公式.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
第八章 X2 检验 卫生(医学)统计学 普通高等教育 “ 十一五 ” 国家级规划教材. X 2 检验用途 1 、推断两个或两个以上的总体率或总体构 成比 之间有无差别; 2 、推断两种属性或两个变量之间有无关联 性; 3 、频数分布的拟合优度检验。
1 问题 儿童品行与家庭教育的关系如何? 一个人智力高低与成绩的 关系怎样? 学生的兴趣与学科成绩的 关系如何? 经费投入与工作效率的关系?人的身高与体重有关吗?
主编 周仁郁. 4.1 非参数检验 配对秩和检验( Wilcoxon 法) 不依赖总体分布类型, 也不对总体参数进行统计推 断的假设检验, 称为非参数检验 配对资料比较时,H 0 为差值总体中位数 M d = 0 H 0 成立时, 配对数据的差值服从以 0 为中心的对称 分布. 把差值按绝对值从小到大用.
资 料 连续型资料 离散型资料 大样本 小样本.
《解析几何》 乐山师范学院 0 引言 §1 二次曲线与直线的相关位置.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
一、二阶行列式的引入 用消元法解二元线性方程组. 一、二阶行列式的引入 用消元法解二元线性方程组.
Pro. Xuezhong SHI, College of Public Health
作者:熊林平.
第七章 非参数统计 非参数统计(亦称非参数检验),是根据样本资料对总体的某种性质或关系进行假设检验的统计推断方法。 主要特点
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
完全随机设计多样本资料秩和检验.
医学统计学 主讲人:信息部 林雪君.
第六章 技术创新与经济增长 本章主要问题 ---技术创新过程 ---技术创新分类 ---技术创新动力源 ---技术创新影响因素
高等数学电子教案 第五章 定积分 第三节 微积分基本定理.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
数 学 分 析 第九章 定积分 第二节 微积分学基本公式 主讲:师建国.
田间试验和统计方法 第九章 直线回归与相关.
不确定度的传递与合成 间接测量结果不确定度的评估
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第十一章 线性相关与回归.
余角、补角.
简单相关与回归 武汉大学.公共卫生学院 卫生统计学教研室.
第一章 商品 第一节 价值创造 第二节 价值量 第三节 价值函数及其性质 第四节 商品经济的基本矛盾与利己利他经济人假设.
第十九章 直线相关和回归分析.
线性相关分析.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
常用的统计检验 作者 Dr. Maria Correa-Prisant 翻译 lvruiqin(DXY)
§3.7 热力学基本方程及麦克斯韦关系式 热力学状态函数 H, A, G 组合辅助函数 U, H → 能量计算
相關分析 Correlation Analysis
第十章 方差分析.
医学统计学 6 主讲人 陶育纯 医学统计学 6 主讲人 陶育纯
第七章 参数估计 7.3 参数的区间估计.
若2002年我国国民生产总值为 亿元,如果 ,那么经过多少年国民生产总值 每年平均增长 是2002年时的2倍? 解:设经过 年国民生产总值为2002年时的2倍, 根据题意有 , 即.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
第四章 一次函数 4. 一次函数的应用(第1课时).
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
第十三章 直线相关与直线回归.
第九节 赋值运算符和赋值表达式.
第十一章 配合物结构 §11.1 配合物的空间构型 §11.2 配合物的化学键理论.
3.1 变化率与导数   3.1.1 变化率问题 3.1.2 导数的概念.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第4课时 绝对值.
第四节 多个样本均数的两两比较 多个样本均数的两两比较又称多重比较(multiple comparison),其目的是推断究竟哪些总体均数之间存在差别。
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第八章 假设检验 8.3 两个正态总体参数的假设检验.
相关关系 主讲人:孟迎芳.
第三节 数量积 向量积 混合积 一、向量的数量积 二、向量的向量积 三、向量的混合积 四、小结 思考题.
一元一次方程的解法(-).
Sssss.
Presentation transcript:

第十一章 两变量关联性分析

本章内容 第一节 线性相关 第二节 秩相关 第三节 分类变量的关联性分析

第一节 线性相关 一 线性相关的概念 线性相关(linear correlation)又称简单相关(simple correlation),用于双变量正态分布(bivariate normal distribution)资料。其性质可由图11-2散点图直观的说明。

目的:研究 两个变量X,Y数量上的依存(或相关) 关系。 特点:统计关系

二、相关系数的意义与计算 意义:相关(correlation coefficient)又称Pearson积差相关系数,用来说明具有直线关系的两变量间相关的密切程度与相关方向。 2. 计算:样本相关系数的计算公式为 (11-3)

例11-2 计算例11-1中凝血酶浓度X与凝血酶时间Y之间样本相关系数。 由例11-1得 , 由公式11-3得

相关系数的特点 1.相关系数r是一个无量纲的数值,且-1<r<1; 2.r>0为正相关,r<0为负相关; 3./r/越接近于1,说明相关性越好./r/越接近于0,说明相关性越差.

相关系数的统计推断 (一)相关系数的假设检验 (11-5) (11-6)

例11-3 继例11-2中算得r=-0926后,试检验相关是否具有统计学意义

检验步骤 本例 n=15,r=-0.926,由公式(11-4)和公式(11-5)得 本例 ,查 界值表得 ,故拒绝 接受 ,认为凝血酶浓度与凝血酶时间之间存在负相关。此结果与查表的结果是一致的。

线性相关中应注意的问题 1.样本的相关系数接近零并不意味着两变量间一定无相关性. 2.一个变量的数值人为选定时莫作相关. 3.出现异常值时甚用相关. 4.相关未必真有内在联系. 5.分层资料盲目合并易出假象.

第二节 秩相关

适用条件: ②总体分布型未知,一端或两端是不确定数值(如<10岁,≥65岁)的资料; ③原始数据用等级表示的资料。 ①资料不服从双变量正态分布而不宜作积差相关分析; ②总体分布型未知,一端或两端是不确定数值(如<10岁,≥65岁)的资料; ③原始数据用等级表示的资料。

一、Spearman秩相关 1. 意义:等级相关系数rs用来说明两个变量间直线相关关系的密切程度与相关方向。 2. 计算公式

例11-4 某地研究2~7岁急性白血病患儿的血小板数与出血症状程度之间的相关性,结果见表11-2,试用秩相关进行分析

表11-2 急性白血病患儿的血小板(109/L)和出血症状 病人编号 血小板数 秩次 p2 出血症状 秩次 q2 pq X p Y q (1) (2) (3) (4) (5) (6) (7) (8)=(3).(6) 121 1 1 +++ 11.5 132.25 11.5 138 2 4 ++ 9.0 81 18 165 3 9 + 7.0 49 21 310 4 16 - 3.5 12.25 14 426 5 25 ++ 9.0 81 45 540 6 36 ++ 9.0 81 54 740 7 49 - 3.5 2.25 24.5 1060 8 64 - 3.5 12.25 28 1260 9 81 - 3.5 12.25 31.5 1290 10 100 - 3.5 12.25 35 1438 11 121 +++ 11.5 132.25 126.25 2004 12 144 - 3.5 12.25 42 合计 — 78 650 - 78 630 451

利用表11-2中的数据容易算得 秩相关系数为负,说明两变量间有负相关关系,同样由样本算得的秩相关系数是否有统计学意义,也应做检验

秩相关系数的统计推断 检验步骤 假设检验 统计推断 当 时,可查书后的 临界值表,若秩相关系数超过临界值,则拒绝 ;当 时,也可采用公式(11-5)或(11-6)式做 检验

例11-5 对例1-4的秩相关系数作假设检验 例11-4中算得 查 临界值表, 例11-5 对例1-4的秩相关系数作假设检验 例11-4中算得 查 临界值表, ,按 的水准,不能拒绝 ,可以认为急性白血病患儿的出血症状与血小板数之间无相关关系

第三节 分类变量的关联性分析

适用条件 对定性变量之间的联系通用的方法是根据两个定性变量交叉分类基数所得的频数资料(列联表)作关联性分析,即关于两种属性独立性的卡方检验 计算公式

交叉分类2×2表的关联分析 例11-6 为观察婴儿腹泻是否与喂养方式有关,某医院儿科随机收集了消化不良的婴儿82例,对每个个体分别观察腹泻与否和喂养方式两种属性,2×2种结果分类记述如表11-3所示,试分析两种属性的关联性。

表11-3婴儿腹泻与喂养方式的关系 喂养方式 腹泻 合计 有 无 人工 30 10 40 母乳 17 25 42 合计 47 35 82

假设检验 :喂养方式与婴儿腹泻之间相互独立 :喂养方式与婴儿腹泻之间有关联 将表中各数据代入公式(7-7)得 , 拒绝原假设,说明婴儿腹泻与喂养方式之间存在关联性.

表11-3 婴儿腹泻与喂养方式的关系 喂养方式 腹泻 合计 有 无 人工 30 10 40 母乳 17 25 42 合计 47 35 82

二 2×2配对资料的关联性分析 例11-7 有56份咽喉涂抹标本,把每份标本一分为二,依同样的条件分别接种于甲乙两种白喉杆菌培养基上,观察白喉菌生长的情况,结果如表11-5,问两种培养基的结果有无关联?

表11-5 两种白喉杆菌培养结果 甲培养基 乙培养基 合计 + - + 22 18 40 - 2 14 16 合计 24 32 56

假设检验 :两种培养基的结果之间互相独立 :两种培养基的结果之间有关联 将本例数据代入公式(7-7)得 有理由拒绝零假设,可以认为甲、乙两种培养基之间存在关联性

三 R×C表分类资料的关联性分析

例11-8 某地居民主要有三种祖籍,均流行甲状腺肿。为探索甲状腺肿类型与祖籍是否有关联,现根据居民甲状腺肿筛查结果,按甲状腺肿类型与祖籍两种属性交叉分类,得表11-6的资料。问甲状腺肿类型与祖籍见有否关联?

表11-6 某地居民按甲状腺肿类型与祖籍两种属性的交叉分类表 表11-6 某地居民按甲状腺肿类型与祖籍两种属性的交叉分类表 祖籍 甲状腺肿类型 合计 弥漫型 结节型 混合型 甲 486 2 4 492 乙 133 260 51 444 丙 100 315 85 500 合计 719 577 140 1436

假设检验 :甲状腺类型与祖籍无关 :甲状腺类型与祖籍有关联 同样作检验得 由 查 界值表, ,拒绝零假设,说明甲状腺肿类型与祖籍之间有关联性 由 查 界值表, ,拒绝零假设,说明甲状腺肿类型与祖籍之间有关联性 计算列联系数

谢谢大家!