Presentation is loading. Please wait.

Presentation is loading. Please wait.

医学统计学 6 主讲人 陶育纯 http://cc.jlu.edu.cn/ms.html http://cc.jlu.edu.cn/ss.html 医学统计学 6 主讲人 陶育纯 2013.5.27.

Similar presentations


Presentation on theme: "医学统计学 6 主讲人 陶育纯 http://cc.jlu.edu.cn/ms.html http://cc.jlu.edu.cn/ss.html 医学统计学 6 主讲人 陶育纯 2013.5.27."— Presentation transcript:

1 医学统计学 6 主讲人 陶育纯 http://cc.jlu.edu.cn/ms.html
医学统计学 6 主讲人 陶育纯

2 第六讲 课程名称:医学统计学 主要教材: «卫生统计学» 第7版 方积乾 主编 人民卫生出版社 年级、专业:2010级白求恩医学班
方积乾 主编 人民卫生出版社 年级、专业:2010级白求恩医学班 授课时间:2013年5月29日 授课时数:4h

3 目录 第十章 两变量关联性分析 第一节 线性相关★ 第二节 秩相关 第三节 分类变量的关联性分析

4 第一节 线性相关 第十章 两变量关联性分析 一、线性相关的概念及其统计描述
例10-1 在某地一项膳食调查中,随机抽取了14名40~60岁的健康妇女,测得每人的基础代谢(kJ /day)与体重(kg)数据,见表11-1。据此数据如何判断这两变量间有无关联?

5 先根据原始数据绘制散点图(scatter plot),大致判断两变量之间是否有线性趋势。 本例的散点图见下图13-1。

6 线性相关(linear correlation)是描述两个变量间互依关系的一种统计分析方法。此法又称简单相关(simple correlation)。此法通过线性相关系数(linear correlation coefficient)描述两个变量线性关系的大小和方向。此法要求两个变量服从双变量正态分布(Bivariate normal distribution)。

7

8

9

10

11

12

13

14 相关系数无单位,其取值范围为-1≤r≤1。r 值为正表示正相关,为负表示负相关,为零表示零相关。r = 1为完全正相关,r = -1为完全负
相关系数又称积差相关系数,也称Pearson相关系数,用r 表示。它是说明具有直线关系的两个变量间,相关关系的密切程度和相关方向的指标。用r 的大小表示密切程度,用r 的正负表示相关方向。其计算公式为: 相关系数无单位,其取值范围为-1≤r≤1。r 值为正表示正相关,为负表示负相关,为零表示零相关。r = 1为完全正相关,r = -1为完全负

15 相关。相关系数r 的直观含义见下列图 。

16

17 二、相关系数的意义和计算 公式(10-4) 公式(10-3)

18 You may use Excel’s functions CORREL() or PEARSON() to get r easily.

19 三、相关系数的统计推断 前面所求相关系数r 是样本相关系数,它实为总体相关系数ρ 的估计值。我们知道即使X、Y的总体相关系数ρ为零,由于抽样误差的存在,样本相关系数r 也不一定为零。因此需要对相关系数r 进行假设检验,以此推断X、Y是否存在直线相关关系。常用t 检验,其检验统计量公式如下: 公式(10-5,6)

20

21 四、应用相关分析的注意事项 Question: The tree made his son growing
Let's see two stories firstly: Story1 Correlation between height of son and tree. A correlation coefficient was calculated at the first anniversary r = 0.97, P<0.05 . Question: The tree made his son growing

22 up quickly, or his son made the tree growing up quickly !?
Story2 Correlation between swimming and ice cream. They calculated a correlation coefficient at the end of observation r = 0.92, P<0.05 .

23 Question: Swimming people must like ice ream, or buying ice ream must go to swimming ?!
Question: if P<0.001, very small, can we say the correlation is very strong? Question: If r=0.90, can you claim the two variables are correlated each other? So many questions !

24 1) Don’t put any two variables together for
correlation They must have some relation in subject matter. 2) Simple correlation = Direct association + indirect association Simple correlation does not necessary mean a direct association. ? ? Son Tree Swimming Ice ream Time Temperature

25 Correlation ≠ Direct association Correlation ≠ Causation
3) After calculating a sample correlation coefficient(r), it is necessary to have a test for H0: ρ = 0, H1: ρ ≠ 0 Rejecting H0 just means ρ ≠ 0 . 4) Before correlation, you should draw a Scatter plot to judge linear tendency or not.

26 Pearson’s Correlation Coefficient (r) is
just for linear relationship between two variables. 5) Linear Correlation requires two variables that should follow bivariate normal distri- bution . You should know the Scatter plot is very important for Linear Correlation & regression!

27 第二节 秩相关 一、秩相关的概念及其统计描述 最常用的统计量是Spearman秩相关系数rS,又称等级相关系数。
SAS统计分析 第二节 秩相关 一、秩相关的概念及其统计描述 秩相关(rank correlation),是推断两个变量间相关关系的一种非参统计分析方法。常用于下列资料:①不服从双变量正态分布资料;②总体分布类型未知;③等级资料。 最常用的统计量是Spearman秩相关系数rS,又称等级相关系数。 教案

28 二、秩相关系数的统计推断(自学) 第三节 分类变量的关联性分析(自学)

29

30 相关计算工具的介绍 第三次作业的总结 C


Download ppt "医学统计学 6 主讲人 陶育纯 http://cc.jlu.edu.cn/ms.html http://cc.jlu.edu.cn/ss.html 医学统计学 6 主讲人 陶育纯 2013.5.27."

Similar presentations


Ads by Google