相關分析 Correlation Analysis

Slides:



Advertisements
Similar presentations
index 目次 ( 請按一下滑鼠,解答就會出現喔 !) 接續下頁解答 3-1 極限的概念.
Advertisements

(学生习作) 相信天生我材必有用,人生必将从暗淡走向精彩。 美国 NBA 是所有篮球运动员向往的舞台。美籍华人林 书豪曾一度作为板凳队员,被埋没多年。可是他没失 去对篮球的热爱,在一次机会中,他大显身手让华人 为之骄傲。多年的埋没没有让他迷失方向,而是取得 了成功。 诊断结果: 以叙代议,缺少分析.
第 三 章 领悟人生真谛 创造人生价值.
专题三 正确使用标点符号 共 300 页.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
SPSS系统教程.
体育与健康 篮球运动基础知识 三台县新德镇初级中学 体育与健康 赖见.
南台科技大學 萬金生教授 九十八年六月十二日
如何撰写对联.
單元七、spss與相關係數 沈瑞棋.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
主题班会 发扬团队精神,争取成功.
NBA.
双变量关联性分析.
國立中正大學勞工研究所 黃良志 副教授 中 華 民 國 九 十 四 年 九 月
一、平面点集 定义: x、y ---自变量,u ---因变量. 点集 E ---定义域, --- 值域.
传播学研究:理论与方法 戴元光 赵士林 邢虹文.
Pro. Xuezhong SHI, College of Public Health
林书豪的生存智慧是什么?(观点) 林书豪为什么要这样做? 林书豪是怎样做的? 林书豪这样做的意义作用是什么? 2013二模
休閒二乙4A1B0030 陳唯玲 休閒二乙4A1B0020 吳嘉雯 休閒二乙4A1B0040 徐巧恩 指導老師:柯玲玫
高三语文复习之 融贯千载,悠悠成语.
主講人 陳陸輝 副研究員 政治大學 選舉研究中心
十八岁和其他 杨子.
管理学基本知识.
思考:收到此信息你会按提示去做吗?为什么?
第十三课 建设和谐文化.
滁州学院首届微课程教学设计竞赛 课程名称:高等数学 主讲人:胡贝贝 数学与金融学院.
老師的啟示.
11. Pearson’s Correlation & Simple Linear Regression
第十一章 体育产业管理 学习目标 主要内容 本章小结 复习题.
相關.
籃球皇帝張伯倫 作者:徐子翔.
多元迴歸 Multiple Regression
早.
村民自治背景下的 乡村关系分析 甘肃行政学院 安林瑞.
摩擦主题读写.
好作文是写出来的!.
拾貳、 教育行政 一、教育行政的意義 教育行政,可視為國家對教育事務的管理 ,以增進教育效果。 教育行政,乃是一利用有限資源在教育參
辨析标点使用的模糊点 课件制作:忻州师院附中 邓占云.
課程銜接 九年一貫暫行綱要( )  九年一貫課程綱要( ) 國立台南大學數學教育系 謝 堅.
2.4 二元一次方程组的应用(1).
团队精神.
第十七章 SPSS系统在传播学研究中的应用
服務業餐飲部門服務品質與顧客滿意度之研究 -以十街咖啡館為例
第十二章 相关与回归分析 第一节 相关关系及种类 第二节 定类变量的相关分析 第三节 定序变量的相关分析 第四节 定距变量的相关分析
第 3 章 敘述統計:數值方法.
统计软件应用 7 主讲人 陶育纯 SPSS统计分析 统计软件应用 7 主讲人 陶育纯 教案.
第六章 因子分分析 §6.1 因子分析的基本理论 §6.2 因子载荷的求解 §6.3 因子分析的步骤与逻辑框图 §6.4 因子分析的上机实现
第一章 線性方程組.
二元隨機變數(Bivariate Random Variables)
統計方法的概念與應用 一、認識統計(statistics)、測驗(test)、 測量(measurement)與評價(evaluation)
線性相關與直線迴歸 基本概念 線性相關:兩個連續變項的共變關係,且有線性關係。所謂 的線性關係乃指兩個變項的關係可以被一條最具
第十七章 相關係數 17.1 前言 17.2 相關係數 17.3 功能視窗(Bivariate) 17.4 範例(Bivariate)
直线相关.
庄文忠 副教授 世新大学行政管理学系 相关分析与简单回归分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2019/4/7.
Liner regression analysis
學習單 1.人體的運動主要會運用到哪些系統來完成?試簡述之。 (1)骨骼、關節 (2)骨骼肌:包括頭頸肌、軀幹肌和四肢肌
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 6 主讲人 陶育纯 医学统计学方法 6 主讲人 陶育纯 流行病与卫生统计学教研室
第捌章 敘述研究法 一、調查研究法(survey method) 二、相關研究法(co relational studies)
数据分析的统计方法选择小结.
第十四章 迴歸.
相關分析 7.1 連續變項之相關係數:Pearson 積差相關 7.2 質化變項之相關係數
身體活動量與健康體適能之現況(1) 本研究身體活動量之統計結果 不同學童背景 平均數 標準差 城市男生 鄉村男生
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心
恆春熱帶植物園區台灣獼猴之攝食策略 (Feeding Strategies of Formosan Macaque (Macaca cyclopis) in Heng-Chun, Southern Taiwan) 碩 士 班 范 孟 雯 前言 依據最適覓食策略理論(Optimal foraging.
 刘翔,在雅典奥运会上夺得男子110米栏的冠军,成为中国田径当之无愧的“第一人”。
Part 3 初等統計與理論.
97學年度第二學期水保系碩專班專題報告 農生再生試辦區之分析探討 報告人:簡榮杰.
簡單迴歸分析與相關分析 莊文忠 副教授 世新大學行政管理學系 計量分析一(莊文忠副教授) 2019/8/3.
用加減消去法解一元二次聯立方程式 台北縣立中山國中 第二團隊.
Presentation transcript:

相關分析 Correlation Analysis 量化研究與統計分析 相關分析 Correlation Analysis 謝寶煖 台灣大學圖書資訊學系 pnhsieh@ntu.edu.tw 2006年4月29日

自變數 依變數 統計分析方法 類別 交叉表 連續 變異數分析 相關分析 迴歸分析

一個例子 很多時候,我們想要知道一件事物與另一件事物之間的關係(relationship) 而且希望能有個關係指標(index of relationship)來說明關係強度,指標小關係強度低,指標大關係強度高;換句話說,需要有個「相關係數」(coefficient of correlation) 例如:有一盒玩具兵,我們對玩具兵的身高、體重有興趣,想像所有的玩具兵都是同樣的身形(shape),那麼身高不同體重也就不同

看看這五個玩具兵,您會怎麼描述他們的身高和體重的關係? 我們可以給個 .00到1.00之間的數值來描述其關係強度(strength),同時說明關係的方向(direction)

coefficient of correlation的種類 The rank-difference coefficient () 等級相關 易理解 排序資料 Spearman rank-difference coefficient of correlation The product-moment coefficient (r) 常用 連續資料 Pearson product-moment coefficient

The rank-difference coefficient 將5個玩具兵的身高和體重加以排序 將相同序位以線段相連,線段形成階梯狀 計算每個玩具兵的身高和體重的排序差異(rank difference),請注意,所有的rank difference都是零 計算rank-difference coefficient,以(rho)表示 是1減掉分子為排序差異分母為比較的樣本,所以數值為介於0與1之間,而且排序排異愈大時,可能會產生負的相關係數

負相關 如果換成真人的話,可能就不一定能和玩具兵一樣都有相同的身形,可能矮胖、高瘦

The product-moment coefficient (r) 其實通常我們不會計算排序差異,而是計算真實的身高和體重,如下表

Concordant Disconcordant

相關分析 當變項為一個連續變數時,可以次數分配和圖示來呈現資料的內容與特性,或者以平均數和標準差來描繪資料的集中和離散情形。 當兩個變數皆為連續變數時,則需利用相關(correlation)或迴歸(regression)來分析兩變數的關聯程度,又稱為共變(covariance)關係。

線性關性 兩個連續變數的共變關係,可能有很多種形式,其中最簡單也是最常見的關聯型態是線性關係(linear relationship)。 兩個變項的關聯關係可以以一條最具有代表性的直線來表示 例如:身高與體重,身高越高,體重也越重 Y=bx+a x為身高,y為體重 b為斜率,x每變動一個單位, y的變動量 身高每增加一公分,體重增加量 當b斜率為正值時,表示兩個變項是正相關 當b斜率為負值時,表示兩個變項是負相關

相關係數 兩個連續變項的關聯情形可以散布圖來呈現 精確的相關分析所產生的是一個相關係數(correlation coefficient),相關係數是介於-1與+1之間的數。 若為+1 ,則表示兩變數具有完全的正線性相關 若為-1,則表示兩變數具有完全的負線性相關 若相關係數趨近於0,則表示兩變數沒有線性相關 此一係數最早由Pearson所提出,又稱為皮氏積差相關係數。

相關係數() 相關程度 1.00 完全相關 .70~.99 高度相關 .40~.69 中度相關 .10~.39 低度相關 .10以下 微弱或無相關

Pearson相關係數 相關係數值的大小,可以反應兩個變項關聯性的強弱,但是相關係數是否具有統計上的意義,必須透過統計檢定來判斷。 由樣本計算兩變項之相關係數Pearson’s r,若要推論到母群 ,必須經由統計檢定由考驗其統計意義 虛無假設H0:兩變項X與Y不相關 (相關係數為0,  =0) 對立假設H1:兩變項X與Y相關 (相關係數不為0,  0) 當雙尾的機率p小於設定的顯著水準(如0.05或0.01)時,則否定虛無假設,即相關係數不為零(兩變項相關)

以籃球得分為例。一個籃球隊獲勝場次與每場的平均得分有關連嗎? 從散佈圖中可看出,它們具有線性關聯。我們再從 1994、1995 NBA 球季分析資料得知,Pearson 的相關係數 (0.581) 在 0.01 水準時是有意義的。於是可能猜想,每季所贏得的場次愈多,則對手的得分愈少。這些變數為負相關 (0.401),而相關在 0.05 水準時最顯著。

相關分析 程序1 程序2 統計圖散佈圖 X軸放自變項;Y軸放依變項 例:X軸為教育程度,Y軸為目前薪資 (dataset: employee) 由散佈圖可以很明顯地看出兩變數之相關程度。再由相關程序求出兩變數之相關係數 程序2 分析相關 雙變數

由散佈圖可以很明顯地看出教育程度與目前薪資有正線性相關。為測量兩變數之線性相關程度,以相關程序求出兩變數間之相關係數。

依Pearson相關係數可知,教育程度和目前薪資的相 關係數為為0. 661,P值為0. 000。當顯著水準為0

相關係數 對於定量、常態分配的變數而言,請選擇「Pearson」相關係數。 如果資料不是常態分配,或已依類別排列,請選擇「Kendall‘s tau-b」或「Spearman」,以便測量等級排列之間的關聯。 Spearman’s Rho()等級相關係數(順序變項) Kendall‘s tau-b ()等級相關係數(concordant和諧) 相關係數範圍的值在 1 (一百分比負關聯) 到 +1 (一百分比正關聯) 之間。其中,數值 0表示沒有任何線性關係。 在解析結果時,請不要因為顯著的相關,而逕下任何跟因果相關的結論。

Concordant:若某一觀察值的兩個變項值皆大於(或皆小於另一觀察值時),則稱此對觀察值為「一致」 (Concordant)。 Discordant:若一觀察值的第一變項值大於另一觀察值,而第二變項值小於另一觀察值時,則稱此對觀察值為「不一致」(discordant)。 Tied:若兩觀察值的一個變項或兩個變項值相等時,則稱此對觀察值相等(tied)。 

相關係數 皮爾森相關(Pearson) Spearman’s Rho()等級相關係數 由於Pearson樣本相關係數()之機率分配會依配對隨機變數(X,Y)之機率分配而變,所以沒有固定的分配,因此在做假設檢定時,一般是假設(X,Y)具有二元的常態分配。 Pearson相關係數之大小,可看出兩變項關係的密切程度。相關係數愈高,兩變項之關係愈密切,愈低表示愈不相關。 Spearman’s Rho()等級相關係數

相關顯著性訊號 相關係數在 .05 水準顯著時,會以一個星號標示,而在 .01水準顯著時,會以兩個星號標示。

等級觀察值 轉換>等級觀察值

等級變項之相關係數為Spearman相關係數

多個雙變量相關分析

負相關

沒有相關

淨相關與部份相關 如果兩個連續變項之間的關係,可能受到第三個變項干擾時,也可以以共變分析的做法,將第三個變項進行統計上的控制。 淨相關 在計算兩個連續變項X1和X2的相關時,將第三變項( X3 )與兩個相關變項的相關X13和X23 ,加以排除之後的單純相關,以X12.3來表示。 部份相關 淨相關是將第三個變項與兩個連續變項X1和X2的相關完全排除之後,計算的單純相關。如果在計算排除效果時,只處理第三變項與X1和X2當中的一個變項的相關時,所計算出來的相關係數,稱之為部份相關(partial correlation) ,或稱半淨相關(semipartial correlation)。

同時測得學生的期中考、期末考成績,以及統計焦慮分數,請問期中考與期末考成績的淨相關如何?兩個部份相關又如何? 程序: 分析>相關>偏相關 選項>勾選零階相關 成對排除遺漏值

零階相關係數 期中考與期末考的Pearson相關為.8219, p=.004達到顯著水準。顯示期中考與期末考成績具有高度相關。 焦慮與期中考的相關為-.8145,且達到顯著(p=.004);焦慮與期末考的相關為-.6062,但未達到顯著(p=.063)。

淨相關係數 期中考與期末考的Pearson相關係數由原來零階相關的.8219降為.7113, p=.032,仍達到顯著水準。 但是因為期末考與統計焦慮之相關沒有達到顯著,所以不用控制統計焦慮求期末考的淨相關,所以應採用部分相關分析。 部份相關係以迴歸分析方式執行,下週分曉。

論文之表格製作1:平均數與標準差

論文之表格製作2:相關矩陣