Download presentation
Presentation is loading. Please wait.
1
Pro. Xuezhong SHI, College of Public Health
第十一章 两变量关联性分析 2017/3/9 Pro. Xuezhong SHI, College of Public Health
2
Dr. Xuezhong SHI, College of Public Heath
主讲人: 施 学 忠 卫生统计学教研室 公 共 卫 生 学 院 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
3
Dr. Xuezhong SHI, College of Public Heath
统计学的两个主要内容 总体参数的估计和检验 假设检验 方差分析 卡方检验 计量资料 计数资料 指标变量之间关系的研究 相关分析 回归分析 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
4
Dr. Xuezhong SHI, College of Public Heath
教学内容 第一节 线性相关 第二节 秩相关 第三节 分类变量的关联性分析 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
5
Dr. Xuezhong SHI, College of Public Heath
教学目的和要求 ①了解利用散点图分析样本相关系数可能出现的各种假象,并作出合理解释。 ②掌握线性相关分析的基本步骤;掌握Pearson积差相关、Spearman等级相关的应用条件及计算方法,同时进行假设检验;对分类计数频数表资料的两变量间的关联性作定量分析。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
6
Dr. Xuezhong SHI, College of Public Heath
教学重点 ①线性相关分析的基本步骤; ②线性相关分析、Pearson积差相关、Spearman等级相关的应用条件及计算方法 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
7
Dr. Xuezhong SHI, College of Public Heath
教学难点 分类变量两样本或多样本的χ2检验与列联表资料χ2检验的区别与联系。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
8
Dr. Xuezhong SHI, College of Public Heath
第一节 线性相关 Linner Correlation 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
9
Dr. Xuezhong SHI, College of Public Heath
大量的医学研究需要对两个变量间的关系进行量化的研究。 —确定两个变量间有否联系及联系程度如何。 —定量地确定它们之间的互依关系。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
10
Dr. Xuezhong SHI, College of Public Heath
例如: 高血压患者的舒张压和年龄 药片的厚度与药物的含量 药片的硬度和药片的消溶速度 婴儿的身高、体重和胸围 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
11
Dr. Xuezhong SHI, College of Public Heath
【典型案例】 随机抽取15名健康成人,测定血液的凝血酶浓度(单位/毫升)及凝固时间,数据如表所示据此判断两项指标间有否相关? 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
12
Dr. Xuezhong SHI, College of Public Heath
表 例健康成人凝血时间与凝血酶浓度测量 受试者号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 凝血酶浓度(单位/毫升) 1.1 1.2 1.0 0.9 0.6 0.7 凝血时间(秒) 16 17 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
13
Dr. Xuezhong SHI, College of Public Heath
【案例解析】 实验设计类型:完全随机设计 研究目的:了解凝血时间与凝血酶浓度两个变量之间的关系 ——相关(correlation) ——回归(regression) 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
14
Dr. Xuezhong SHI, College of Public Heath
相关和回归分析 常数:ρ 依存性 (relationship) 变 量 之 间 的 关 系 关联性 (association) 相关分析 回归分析 数学模型: Y=f(X) 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
15
Dr. Xuezhong SHI, College of Public Heath
一、线性相关的基本概念 相关分析 (correlation analysis) 研究两个或多个变量之间关联性或关联程度的一种统计分析方法。 相关系数 (correlation coefficient) 描述具有线性关系的两变量间,相关关系的密切程度(大小)和相关方向的指标,一般用r和ρ来表示。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
16
Dr. Xuezhong SHI, College of Public Heath
散 点 图 1.正相关 2.负相关 3.非线性相关 4.零相关 散点图能直观地看出两变量间的关系,因此研究两变量的关系应先绘出散点图,而后再确定两者的量化关系 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
17
Dr. Xuezhong SHI, College of Public Heath
3.相关分析的分类 根据变量个数: 简单相关 simple correlation(直线相关 linear correlation) 偏相关 partial correlation : 在其它变量不变时,两个变量之间的关联性 根据数据的正态分布性: 参数分析方法 (Pearson) 非参数分析方法 (Spearman) 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
18
Pearson积差相关系数 coefficient of product-moment correlation
相关系数= 用r表示样本相关系数,表示ρ总体相关系数。它是说明有直线关系的两变量间,相关关系密切程度和相关方向的统计指标。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
19
Dr. Xuezhong SHI, College of Public Heath
若ρ=0,称X和Y不相关 若ρ≠0,则X和Y线性相关 相关系数没有量纲,取值范围[-1,1] 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
20
Dr. Xuezhong SHI, College of Public Heath
相 关 系 数 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
21
Dr. Xuezhong SHI, College of Public Heath
相关系数的特点 (1)相关系数r是一个无量纲的数值,且一1<r<1; (2)r>0为正相关,r<0为负相关; (3) 越接近于1,说明相关性越好, 越接近于0,说明相关性越差。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
22
Dr. Xuezhong SHI, College of Public Heath
二、 简单相关分析的方法步骤 (一)绘制散点图,看有无线性关系 (二)估计简单相关系数ρ (三)检验简单相关系数ρ 是否有统计学意义 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
23
Dr. Xuezhong SHI, College of Public Heath
(一)绘制散点图 图 凝血时间与凝血酶浓度散点图 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
24
Dr. Xuezhong SHI, College of Public Heath
(二)估计简单相关系数ρ 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
25
Dr. Xuezhong SHI, College of Public Heath
2017/3/9 Dr. Xuezhong SHI, College of Public Heath
26
Dr. Xuezhong SHI, College of Public Heath
2017/3/9 Dr. Xuezhong SHI, College of Public Heath
27
Dr. Xuezhong SHI, College of Public Heath
(三)相关系数ρ 的假设检验 由于抽样误差的存在,我们计算出来的样本相关系数未必等于总体相关系数,所以需要对相关系数进行假设检验。 若ρ≠0,说明X与Y之间有线性关系。 若ρ=0,说明X与Y之间无线性关系,但也可能存在其它相关关系。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
28
Dr. Xuezhong SHI, College of Public Heath
为了对相关系数作假设检验,我们先假定X和Y均服从正态分布,有两种常用方法: 一是直接查P454 r临界值表(自由度=n-2),比较 与临界值,统计量越大,概率P越小;统计量越小,概率P越大。 二是采用t检验,这在实际应用中更普遍。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
29
Dr. Xuezhong SHI, College of Public Heath
ρ的假设检验 H0: ρ=0 H1: ρ≠0 Sr 是ρ的估计值r 的标准误 查ν=n-2 的 t-分布表(附表2)。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
30
Dr. Xuezhong SHI, College of Public Heath
2017/3/9 Dr. Xuezhong SHI, College of Public Heath
31
Dr. Xuezhong SHI, College of Public Heath
【电脑实验】 数 据 录 入 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
32
Dr. Xuezhong SHI, College of Public Heath
线性相关分析的SPSS过程: 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
33
Dr. Xuezhong SHI, College of Public Heath
线性相关分析的结果: 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
34
Dr. Xuezhong SHI, College of Public Heath
【结果解释】 结果表明,血液凝血酶浓度和凝固时间存在较强的负相关,相关系数为-0.926。 ? 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
35
Dr. Xuezhong SHI, College of Public Heath
【小结】 1.样本的相关系数接近零并不意味着两变量间一定无相关性。只能说明两变量之间无线性相关关系,但还可能存在其他非线性关系。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
36
Dr. Xuezhong SHI, College of Public Heath
【小结】 2.一个变量的值人为选定时莫作相关 药物的剂量一反应关系; 温度-细胞计数的关系; 因为剂量和温度不是随机变量。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
37
Dr. Xuezhong SHI, College of Public Heath
【小结】 3.出现异常值时慎用相关。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
38
Dr. Xuezhong SHI, College of Public Heath
【小结】 4. 相关未必真有内在联系。 如某农民喜得一贵子,于是在自家门前种了一棵小树留做纪念,结果发现:随着小树的逐渐长高,儿子的身高也在逐渐上长,于是他得出结论:儿子的身高与树高呈正相关。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
39
Dr. Xuezhong SHI, College of Public Heath
【小结】 5. 分层资料盲目合并易出假象。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
40
Dr. Xuezhong SHI, College of Public Heath
第二节 秩 相 关 Rank Correlation 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
41
Dr. Xuezhong SHI, College of Public Heath
【典型案例】 例11-4 某地研究2 -7岁急性白血病患儿的血小板与出血症状程度之间的相关性,结果见表11-2,试进行相关分析。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
42
Dr. Xuezhong SHI, College of Public Heath
2017/3/9 Dr. Xuezhong SHI, College of Public Heath
43
Dr. Xuezhong SHI, College of Public Heath
【案例解析】 血小板出血症状程度是个等级资料,因此在进行相关分析时,不能用pearson相关 ,因为pearson相关 要求资料呈双变量正态分布。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
44
Dr. Xuezhong SHI, College of Public Heath
对于不服从正态分布的资料 或总体分布未知的资料 或等级资料 应进行秩相关分析。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
45
Dr. Xuezhong SHI, College of Public Heath
一、秩相关的概念 秩相关(rank correlation)又称等级相关,是一种非参数统计方法,适用于资料不是正态双变量或总体分布未知;数据一端或两端有不确定值的资料或等级资料。 等级相关分析的方法有多种,在此仅介绍Spearman等级相关,它是利用两变量的秩次大小做相关分析,说明两个变量间相关关系的密切程度与相关方向的。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
46
Dr. Xuezhong SHI, College of Public Heath
二、秩相关系数的计算 Pi:X的秩次;qi:Y 的秩次 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
47
Dr. Xuezhong SHI, College of Public Heath
三、秩相关系数的统计推断 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
48
Dr. Xuezhong SHI, College of Public Heath
【电脑实验】 数 据 录 入 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
49
Dr. Xuezhong SHI, College of Public Heath
秩相关分析的SPSS过程: 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
50
Dr. Xuezhong SHI, College of Public Heath
相关分析的SPSS结果: 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
51
Dr. Xuezhong SHI, College of Public Heath
【结果解释】 结果表明,急性白血病患儿的血小板与出血症状程度无相关。 ? 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
52
Dr. Xuezhong SHI, College of Public Heath
第三节 分类变量的关联性分析 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
53
Dr. Xuezhong SHI, College of Public Heath
【典型案例】 例11-6 为观察婴儿腹泻是否与喂养方式有关,某医院儿科随机收集了消化不良的婴儿82例,把该院儿科所有消化不良的患儿视为一个总体的话,则该82例患儿可看作是一份随机样本。对每个个体分别观察腹泻与否和喂养方式两种属性,试分析两种属性的关联性。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
54
Dr. Xuezhong SHI, College of Public Heath
2017/3/9 Dr. Xuezhong SHI, College of Public Heath
55
Dr. Xuezhong SHI, College of Public Heath
(一)计算列联系数 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
56
Dr. Xuezhong SHI, College of Public Heath
(二)列联系数的假设检验 等价于配对四格表关联性分析的卡方检验 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
57
Dr. Xuezhong SHI, College of Public Heath
【电脑实验】 数 据 录 入 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
58
Dr. Xuezhong SHI, College of Public Heath
SPSS运算过程 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
59
Dr. Xuezhong SHI, College of Public Heath
SPSS运算过程 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
60
Dr. Xuezhong SHI, College of Public Heath
SPSS运算结果 列联系数的假设检验 列联系数 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
61
Dr. Xuezhong SHI, College of Public Heath
【结果解释】 结果表明,婴儿腹泻与母亲喂养方式之间存在关联,其列联系数为0.329。 ? 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
62
Dr. Xuezhong SHI, College of Public Heath
2017/3/9 Dr. Xuezhong SHI, College of Public Heath
63
Dr. Xuezhong SHI, College of Public Heath
2017/3/9 Dr. Xuezhong SHI, College of Public Heath
64
Dr. Xuezhong SHI, College of Public Heath
【电脑实验】 数 据 录 入 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
65
Dr. Xuezhong SHI, College of Public Heath
SPSS运算结果 列联系数 列联系数的假设检验 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
66
Dr. Xuezhong SHI, College of Public Heath
【结果解释】 结果表明,甲状腺种类型与祖籍有关联,其列联系数为0.579。 ? 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
67
Dr. Xuezhong SHI, College of Public Heath
【小结】 积差相关系数 定量变量 双变量正态分布 YES NO 秩相关系数 定性变量 列联系数 两变量关联性分析 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
68
Dr. Xuezhong SHI, College of Public Heath
Pearson积差相关系数 适用条件:双变量正态分布资料。 表示方法:r 注意事项:不可用相关系数检验所得P值的大小来判断有否线性关系。一定要先绘制散点图,看出两变量间有线性趋势时,再计算积差相关系数。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
69
Dr. Xuezhong SHI, College of Public Heath
Spearman秩相关 适用条件: —不满足正态分布的两变量随机样本 —等级资料 表示方法:rs 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
70
Pearson积差相关和Spearman秩相关的主要联系
两者都可用于刻划两变量间线性相关的方向与密切程度,其取值范围与数值大小的统计学意义解释也相同。 两者都要求个体间满足独立性。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
71
Dr. Xuezhong SHI, College of Public Heath
Pearson列联系数 适用条件:定性资料(一份随机样本,同时按两种属性分类), 当两变量都是无序分类变量或一个是无序分类变量、另一个是有序分类变量时。 表示方法:r 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
72
Dr. Xuezhong SHI, College of Public Heath
【案例讨论(一)】 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
73
Dr. Xuezhong SHI, College of Public Heath
2017/3/9 Dr. Xuezhong SHI, College of Public Heath
74
Dr. Xuezhong SHI, College of Public Heath
【案例解析】 Pearson 积差相关在对两定量变量间的相关性分析的实际问题中有广泛的应用,但应注意其适用条件,即双变量正态分布,例如这里的水质的碘含量是定量资料,是否正态分布权且不论,但甲状腺肿的患病率是属二项分布的分类资料,这显然不符合Pearson积差相关的条件,这份资料实际上该作Spearman等级相关。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
75
Dr. Xuezhong SHI, College of Public Heath
【案例讨论(二)】 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
76
Dr. Xuezhong SHI, College of Public Heath
【案例解析】 这里是三组独立样本的比较,据此不能考察关联性和计算关联系数。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
77
Dr. Xuezhong SHI, College of Public Heath
【案例讨论(三)】 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
78
Dr. Xuezhong SHI, College of Public Heath
2017/3/9 Dr. Xuezhong SHI, College of Public Heath
79
Dr. Xuezhong SHI, College of Public Heath
【案例解析】 这里年龄和疗效都是有序变量,应当采用Spearman等级相关系数,而不应采用Pearson列联系数。 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
80
Dr. Xuezhong SHI, College of Public Heath
【最佳选择题】 1.积差相关系数的计算公式是_______。 A. B. C. D. ? 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
81
Dr. Xuezhong SHI, College of Public Heath
2. 相关系数的检验可用________。 A.散点图直接观察法代替 B. t检验 C. F检验 D. 卡方检验 E. 以上都可 ? 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
82
Dr. Xuezhong SHI, College of Public Heath
3.计算积差相关系数要求________。 A. 因变量Y是正态变量,而自变量X可以不满足正态的要求 B. 自变量X是正态变量,而因变量Y可以不满足正态的要求 C. 两变量都要求满足正态分布规律 D. 两变量只要是测量指标就行 E. 因变量Y是定量指标,而自变量X可以是任何类型的数据 ? 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
83
Dr. Xuezhong SHI, College of Public Heath
4 对两个分类变量的频数表资料作关联性分析,可用_______。 A. 积差相关 B. 秩相关 C. 列联系数 D. 线性相关 E. 等级相关 ? 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
84
Dr. Xuezhong SHI, College of Public Heath
5.对R×C列联表资料作频数分布的比较与作两变量关联性分析_______。 A.设计不同,统计量一样 B. 两者仅假设不同 C. 两者仅结论不同 D. 两者的P值不同 E. 两者检验水准不同 ? 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
85
Dr. Xuezhong SHI, College of Public Heath
思考题 1.Pearson积差相关与Spearman等级相关有何异同? 2.比较分类变量的两个样本或多个样本的频数分布所采用的检验与关联性分析的检验有何异同? 3.分类变量配对的2×2资料在什么情况下用McNemar检验,什么情况下用Pearson检验? ? 2017/3/9 Dr. Xuezhong SHI, College of Public Heath
Similar presentations