單元七、spss與相關係數 沈瑞棋
學習標目標 理解相關係數的基本理論及類型 能夠因應二變項測量尺度的不同,選擇適當的相關係數計算方法。 能夠利用繪圖方式,檢視二變項間之關係,並檢查資料中是否出現極端值。 能夠利用spss計算各種相關係數,解釋報表輸出結果,並進行相關係數的假設考驗。
關聯分析 兩變數關聯分析原理 關聯分析是根據兩變數的尺度,選擇適當的統計量來加以衡量變數之間的關聯程度。故相關分析只是關聯分析的一種,相關係數只是關聯係數的一種,關聯的內涵較相關大許多,但在實際應用上,仍以Pearson相關係數與卡方值( )最為常見。 關聯分析中最重要的兩種分析方法: 相關分析。 交叉分析表的卡方檢定
關聯分析的統計量 在許多研究中,皆非常注意變數間相互依存的強度及性質,將變數間的關聯(Association)情形加以數量化,所得到之指標稱為關聯量數(Measures of Association)。根據變數尺度不同,可得下列表格之關聯度量表:
區間或比率變數 順序變數 名目變數 Pearson積差相關 淨相關係數 點二系列相關 二系列相關 多系列相關 Spearman等級相關係數 Gamma 係數 Somer’s d係數 Kendall 和諧係數 Kendall 和諧係數 卡方獨立性考驗 Pearson卡方值 列聯係數(33) 相關係數(22) Cramer’s V係數 (42,36) 對稱係數
相關分析的原理 相關(Correlation)是用以檢驗兩個變數線性關係的統計技術,兩個連續變數的關聯情形,除了用散佈圖的方式來表達外,尚須建立一套統計的運算檢驗模式來進行精確的分析,亦即建立一個用來描述相關情形的量數,稱為相關係數(Coefficient of Correlation)。相關係數有二個特性: 一為相關係數大小的絕對值愈大,表示兩個變數間的關聯性愈強,絕對值愈小,表示兩個變數間的關聯性愈弱。 二為相關係數的正負,表示兩個變數之間是順向或反向的關係。 相關分析時根據變項性質屬性,而有不同的相關方法。相關係數可表示相關的程度/強弱(magnitude)與方向(direction)。如以變數個數來區分,可以分為簡單相關與多元相關(複相關),以關係性質來區分,可分為線性或非線性的關係(曲線相關)。 線性關係(Linear Relationship)指兩連續變數之間的關係,可以被一條最具代表性的直線來表達其存在的關聯情形。
相關係數的計算 用來測量兩變數間的關聯程度之相關係數可以分為二類: 為A型相關係數: 為B型相關係數: 其值介於0與1之間。 此種相關係數的值愈接近於0,表示二個變數之間關聯強度愈弱;反之,如果其相關係數值愈接近1,表示二變數間關聯強度愈強。 相關分析中屬於A型的相關法: 等級相關、列聯相關、相關、Kendall和諧係數、 Kappa一致性係數、曲線相關。 為B型相關係數: 其值介於-1與1之間。 如果變數間的相關係數的值為0時,稱為『零相關』,相關係數的值大於0時,稱為『正相關』,相關係數的值小於0時,稱為『負相關』。 相關分析中屬於B型的相關法: 積差相關、點二系列相關、二系列相關。
相關係數的計算 若以變數的個數來區分,可分為簡單相關與多元相關(複相關)。 如以相關性質來區分,可分為線性與非線性的關係: 如以相關係數的絕對值來看,其絕對值愈接近於0者,表示二個變數之間關聯強度愈弱;反之,其絕對愈接近1者,表示關聯強度愈強。相關係數為1者稱為『完全正相關』,相關係數為-1者稱為『完全負相關』,在統計理論上是存在的,但在行為科學及社會科學領域的實際研究中卻很難發現。 若以變數的個數來區分,可分為簡單相關與多元相關(複相關)。 簡單相關只探討二個變數間的關係。 複相關則可探討三個以上變數之間的關係,其係數稱為多元相關係數。 如以相關性質來區分,可分為線性與非線性的關係: 線性關係表示二個變數間的相關情形可用直線來描述。 非線性關係即非線性關係,又稱為曲線相關。
Pearson 積差相關 適用時機: 離均差交乘積(SS):二個變數每個觀察值與平均數之差的交乘積。 離均差交乘積和:離均差交乘積的總和 積差相關適用於二個變數均為連續變數,亦即二個變數均為區間(等距)或比例(比率)變數,或一個變數為等距變數,另一個為比率變項。 離均差交乘積(SS):二個變數每個觀察值與平均數之差的交乘積。 離均差交乘積和:離均差交乘積的總和
積差相關 共變數: 共變數與積差相關有密切關係。 是離均差交乘積和除以總數(樣本數) 在推論統計中,共變數是二個變數間關係的未標準化量數,等於離均差交乘積和除以n-1,n-1即為自由度。 所謂共變數就是二個變項共同改變的情形。 例如:二個變數X與Y,如果X的改變和Y的改變沒有關聯,那麼共變數的值就是0,共變數等於0表示二個變項是零相關。如果X變得愈大/愈小,Y也跟著變得愈大/愈小,則共變數的值大於0,表示二變數正相關。反之,如果X變得愈大/愈小,Y也跟著變得愈小/愈大,則共變數的值小於0,表示二變數負相關 共變數與積差相關有密切關係。 樣本共變數的公式:
積差相關 共變數的概念與變異數的概念是相通的,不同只是在變異數分析只針對一個變數,但在共變數分析則針對二個變數。 一個x變數的樣本變異數公式如下: 共變數可以用來判斷二個變數的關聯方向,方向可能是零相關、正相關、負相關,但因共變數的大小會隨尺度的不同而不同,所以共變數無法用來判斷二個變數之間關聯的強度。為了要互相比較,必須將共變數標準化,也就是將共變數除以二個變數的標準差,如此一來就不會受到單位不同的影響。 共變數除以二個變數的標準差的值稱為積差相關係數,或稱皮爾遜積差相關係數。
積差相關係數(Pearson 積差相關係數) 共變數除以二個變數的標準差的值稱之。其公式如下:
例題一 某一研究想了解國中學生數學成績與自然成績間有無顯著關係存在,從某國中生三年級中抽取十位學生,其成績如下表示,試問研究者如何解釋此結果? 學生 成績 A B C D E F G H I J 數學成績 74 76 77 63 61 69 80 58 75 自然成績 84 83 85 79 73 92 70
例題一解 本研究的對立與虛無假設如下: 以SPSS分析的步驟: 『分析』功能表選取『相關』『雙變數』出現『雙變數相關分析』對話視窗,將上邊二個變數『數學成績』與『自然成績』選入右邊『變數』下的空盒中在『相關係數』方盒中勾選『Pearson相關係數』及最下方『相關顯著性訊號』 按右下角『選項』鈕,出現『雙變數相關分析:選項』次對話視窗,勾選『統計量』方盒中之『叉積離差與共變異數矩陣』, 『平均數與標準差』 『繼續』鈕,回到『雙變數相關分析』對話視窗按『確定』鈕。
雙變數相關分析 在『雙變數相關分析』對話視窗中,其下方『相關係數』方盒中,SPSS提供三種相關係數供使用者選擇,操作時必須選擇一項: 『Pearson相關係數』:為SPSS內定的選項。結果輸出時會呈現相關矩陣,中間對角線為變項與變項自身的相關,相關係數均為1,對角線的上三角和下三角是對稱,數值則都相同。 『Kendall’s tau-b相關係數』:是一種等級相關係數(),用以測量二個次序變數之相關程度的無母數量數。例如:二位評分者評分結果是否為一致的等級相關指標量數。 『Spearman相關係數』:是一種等級相關係數(),適用於變數為次序變項或可以轉換成次序變項的連續變項,或沒有滿足常態性假設的等距變項。
雙變數相關分析 如勾選最下方的『相關顯著性訊號』,則在輸出結果報表中,會於相關係數邊附加『*』星號以代表顯著水準,機率值(顯著性)達到0.05顯著水準則呈現一個『*』號;達到0.01顯著水準則呈現二個『**』;如果顯著水準小於0.001也是呈現二個『**』號。 在按『選項』鈕,會出現『雙變數相關分析:選項』次對視窗,在此視窗中按『統計量』方盒可以選擇是否印出下列統計量: 『平均數與標準差』:印出每一個變數的平均數、標準差、有效值個數等。 『叉積離差與共變異數矩陣』:印出每一個變數的離均差交乘績和與共變數。 在『雙變數相關分析:選項』次對視窗內的下方『遺漏值』方盒中,有二種處理遺漏值的方法: 『成對方式排除』:是SPSS的內定選項,將含有遺漏值資料的單一觀察值從分析中排除,不納入相關分析之資料。 『完全排除遺漏值』:將含遺漏值的整筆觀察值,在所有的相關分析中均加以排除。
例題一解 SPSS報表說明: 上述描述統計量為自然成績、數學成績二個變數的平均數、標準差與有效樣本數。
報表說明 相關係數=0.879 p=0.0010.05,應拒絕虛無假設(二者相關=0),接受對立假設(二者相關不等於0),表示二個變數間有顯著的相關存在,由於相關係數為正,因而可知數學成績與自然成績二者之間為正相關,即二者有顯著的正相關存在。 結論: 數學成績與自然成績的相關為0.88**,二者有顯著的正相關存在,表示數學成績愈高者,學生的自然成績也會愈高,變項間的決定係數r2為0.7744,表示數學成績可以被自然成績解釋的變異量為77.44%;相對的自然成績可以被數學成績解釋的變異量亦為77.44%。
報表說明 『決定係數』(coefficient of determination)即變異數分析中的『關聯性強度係數』或效果值的大小。 在相關係數的解釋時,不能只解釋相關係數的大小及其顯著性,還要解釋『決定係數』,決定係數即為相關係數的平方,決定係數也就是變項可以解釋另外一變項的變異量的百分比,在『迴歸預測分析』中表示:『在依變項Y的總變異量中,被自變項X所能解釋的變異量百分比或自變項X能解釋依變項Y變異量的百分比』。 積差相關中相關係數絕對值的大小可表示關聯強度,但二個變項的關聯強度並不是與 值成正比,而是與 成正比。 相關係數本身不是一個等距變項,也不是一個比例變項。係數間沒有倍數關係,其大小與樣本的變異程度有關,如果兩變項的變異數太小(同質性很高),會使相關係數變小;此外,也受到測量誤差與團體異質性程度影響。
解釋相關係數應注意事項 解釋相關係數時應注意下列幾點 二變項之間的相關係數須經過假設考驗,不能直接以其係數值大小作為判斷依據。 二變項之間有相關,不一定表示二者間有因果關係存在,因為二個變項可能同時為因、或同時為果。 絕對值相等符號不同的相關係數,代表二變項間方向不同,但其關聯程度是一樣的。 積差相關係數適用於直線關係,二個變數之間沒有直線相關,不一定表示二個變數完全沒有關聯,因為二個變項可能有曲線相關存在。 相關係數並沒有倍數關係,例如:不能說相關係數為0.6的二個變項其關聯強度是相關係數為0.3二個變項的二倍,只能說前者的關聯強度比後者大。 為確定二變項間是否為直線相關,可以用散佈圖來確定是否為直線關係。 相關係數可以換算為決定係數,用以解釋變異量的比率。
變數之相關係數與其相關程度的劃分 通常有下列二種分級狀 第一種分成三級 第二種分成五級 高度相關:r值在0.8以上(包含0.8)
簡單迴歸與積差相關
練習題、(資料檔為bank.sav) 有一研究想要了解474企業員工在起薪、目前薪資、任職年資及創意評估測驗表現等四個變項間的相關情形。 請問在該企業裡474名員工在起薪、目前薪資、任職年資及創意評估測驗表現等四個變項間是否有顯著的相關?
『離均差平方和與交叉乘積矩陣』,簡稱為SSCP將SSCP矩陣中各元素除以N-1可得下面『變異數及共變數矩陣』簡稱為VAR-COV矩陣 起薪 目前薪資 任職年資 創意評估測驗 1066380823.4 3625174173.6 2485477.962 -9749.658 3625174174 22114240156 10836432.557 -251546.610 9676.557 -135.033 1939.982 『離均差平方和與交叉乘積矩陣』,簡稱為SSCP將SSCP矩陣中各元素除以N-1可得下面『變異數及共變數矩陣』簡稱為VAR-COV矩陣
起薪 目前薪資 任職年資 創意評估測驗 2254504.912 7664216.012 5254.710 -20.612 46753150.435 22910.005 -531.811 20.458 -0.285 4.101 『變異數及共變數矩陣』VAR-COV矩陣中對角線素除以該變項的變異數(即除以標準差二次),非對角線元素除以所對應二變項標準差乘積。就是二變項積差相關係數所構成之矩陣,稱為相關矩陣
起薪 目前薪資 任職年資 創意評估測驗 1 0.747 0.774 -0.007 0.741 -0.038 -0.031
Kendall’s tau等級相關 如果改求十位受試者在數學成績排序與自然成績排序之等級相關情形,則應採用等級相關,適用於樣本數較小或受評的作品較少時。 在『雙變數相關分析』對話視窗中,勾選 『Kendall’s tau-b相關係數』 結果可得Kendall’s tau-b相關係數等於0.659;p=0.009,達顯著水準,十位受試者二科成績的排序情形有顯著相關存在。
無母數相關
Spearman等級相關 Spearman等級相關適用於二個變項均為次序變項,資料建檔時可以直接輸入評定為等級或原始成績,如果原始成績為連續變項,spss運算時會先轉化為等級,再求二個變項間的相關,適用於樣本數較多時。 例如:英文作文比賽,想了解評分是否具有信度。如果評分結果等級一致性很高,表示評分的信度很高。 在『雙變數相關分析』對話視窗中,勾選 『Spearman相關係數』 結果可得Spearman 相關係數等於0.841;p=0.002,達顯著水準,十位受試者二科成績的排序情形有顯著相關,與上述採用Kensall等級相關分析之結果相同。
無母數相關
相關─細格期望次數小於5之分析 適用時機: 適用於二個變數均為名義二分變項的資料,亦即二個變項均為二分類別變數。二分類別變數間適用之相關法除相關外,也可採用『列聯相關』進行卡方考驗。 一般在求二個二分名義變項間的關係,應採用相關,也就是22列聯表中的關聯係數。如果其中一個變項是三分變項以上,則不適合採用相關分析。因為當二個類別變項中,任何一個變項的水準在二個以上時,卡方值會大於樣本數,造成相關係數大於1的情形。所以,在RC方型列聯表中,如果R或C的水準均大於2(例如:33、44列聯表)則應採用『列聯係數』;如果名義變項的類別不一樣(R的水準數不等於C的水準數;例如:23、34等)此時應採用『Cramer’s v係數』較為適宜。 當卡方( )考驗時,如果細格中理論的期望次數小於5時,則需進行『耶氏校正法(Yate’s correction for continuity)』,以避免卡方值高估而發生錯誤的結論。
相關 當樣本數很少時,而且22列聯表係由二組不同受試者的間斷變數資料所構成,此間斷變數可能為名義或次序變數,則使用無母數統計法中的『費雪爾正確概率考驗(Fisher’s exact probability test)』較洽當 相關與卡方考驗之間的關係如下: Cramer’s V係數=
例題二 研究者想研究國中學生父母管教方式(權威式管教、民主式管教)和學生攻擊性行為(有攻擊性行為、無攻擊性行為)間有無顯著關係存在? 從某一國中二年級男學生中隨機抽取15位學生,所得資料如下,研究者該如何解釋其結果?
例題二 管教方式:0表示權威式管教,1表示民主式管教 攻擊性行為:0表示有攻撃性行為,1無攻擊性行為 A B C D E F G H I J K L M N O 管教方式 1 攻撃行為 管教方式:0表示權威式管教,1表示民主式管教 攻擊性行為:0表示有攻撃性行為,1無攻擊性行為
報表說明 由上表中得知:父母管教方式與學生攻擊性行為二變項間之卡方值等於6.234,自由度為1時p=0.013達到0.05顯著水準。表示『父母管教方式』與『學生攻擊性行為』間有顯著相關存在。 當進行卡方檢定時如果細格理論的期望次數小於5,要進行『耶氏校正法』,其值為3.654,p=0.056大於0.05,因此應接受虛無假設,表示『父母管教方式』與『學生攻擊性行為』間無顯著相關存在。 造成二個完全相反的結論,在於取樣的樣本太少,細格理論期望次數小於5,造成卡方值高估的現象。 本例採以卡方檢定進行二變項間相關之假設考驗,應採用第二種Yate’s校正卡方值,做出『父母管教方式』與『學生攻擊性行為』間無顯著相關存在的結論。
例題三 某教育學者想研究國中學生家庭結構與攻擊行為間的關係,採隨機抽樣本方式?抽取45個樣本數據如下表,統計分析該學者要如何解釋? 攻擊行為 總和 有 沒有 家庭結構 單親家庭 15 6 21 完整家庭 3 24 18 27 45 解:上述問題中,家庭結構以home變數表示,以0表單親家庭、1表完整家庭。攻擊行為的變數名稱為beha,以0表示有攻擊行為、1表示沒有攻擊行為。
上表為卡方考驗結果,由於沒有細格理論次數小於5,因而直接看Pearson卡方值,卡方值=16. 205,在自由度等於1時,p=0
實作練習 某一資訊教育學者想研究企業員工性別(以0代表男性,1代表女性)與資訊技能檢測成果(0代表通過,1代表未通過)是否有所關聯?抽取60個樣本數據如下表所示。 技能檢定 總和 通過 未通過 性別 男生 21 9 30 女生 10 20 31 29 60 解:上述問題中,員工性別為二分名義變項,而資訊技能檢測也為二分名義變項,此種求二個二分義變項間關係,應採用相關。相關也就是22列聯表中的關聯係數。
練習題:(資料檔為ex6-3.sav) 有一研究者想要了解學生處理衝突方式(分攻擊與講理二種),與是否觀看暴力電視節目有無關聯存在。下表為隨機抽取二十名學生,採問卷調查所得到的結果,其中在『衝突處理方式』變項中,1代表採攻擊方式,0代表採講理方式;在『是否觀看暴力電視』變項中,1代表是,0代表否。 學生 A B C D E F G H I J K L M N O P Q R S T 衝突處理方式 1 是否觀看暴力電視
列聯相關 適用於二個變數均為類別變項,二類別變數的類別水準相同的情況下。列聯變項兩個數的類別不一定要有某種次序關係存在,兩個變數的分數也不一定要有連續性,只要可分成IJ等各種形式的列聯表皆可以適用,其中I不一定要等於J,但列聯相關較常用於I2、J2的『方型』列聯表資料。 列聯相關係數的計算公式可以表示如下: 檢定列聯相關係數是否顯著,如果列聯表檢定之值達到顯著,則列聯相關係數亦達顯著。列聯相關係數C最小值是0,最大值則取決列聯表的大小,如果,是RR方型的列聯表,則C的最大值是 如果二個變數均為二分名義變項(22列聯表資料),則採用相關或列聯相關,如果二個變數的類別水準數不一樣(IJ的長方型列聯表資料),則較常採用Cramer’s V相關。
例、列聯相關(列聯相關.sav) 某位教育學者想要探討國小退休教師社會參與頻率與其退休後生活滿意度的關係。從退休教師母體中隨機抽取1051位教師,試問退休教師的參與頻率與其退休後生滿意度是否有顯著的相關? 社會參與 時常參加 偶而參加 很少參加 生活滿意 很滿意 250 129 60 無意見 150 140 88 不滿意 45 87 102
上表為列聯相關係數量數,其中列聯相關係數C=0. 313,P=0. 000小於0 上表為列聯相關係數量數,其中列聯相關係數C=0.313,P=0.000小於0.05,其顯著的機率值與Pearson卡方所呈現的機率值相同。由於卡方檢定顯著,因而列聯相關亦達顯著,二者關係如下:
實例練習、列聯相關 有一社會學家想了解參與宗教活動頻率與家庭生活狀況間的關係。下表是他隨機抽取1100名大學生調查所得到的結果。試問二者間是否有相關存在? 參與宗教活動頻率 常參加 偶而參加 很少參加 家庭生活狀況 很快樂 273 153 30 無意見 195 170 24 不快樂 86 78 91
列聯相關與Cramer’s V係數都是用來檢定二個二分以上名義變項間相關之統計方法,列聯相關適用於二個變類別數相同之名義變項;而Cramer’s V則適用於二個變項類別數不一樣之情形。 本例一個變項都包括三個類別,二者構成一個33之列聯表,因此應該採用列聯相關進行假設檢驗。
本例的卡方值為158. 830,在自由度為4時,p值為0. 000己達到0 本例的卡方值為158.830,在自由度為4時,p值為0.000己達到0.05的顯著水準,表參與宗教活動頻率與家庭生活狀況二變項有關存在。細格期望次數之最小值為33.61,並沒有細格理論次數小於5之問題,因此spss不會輸出Yate’s校正卡方值之檢定結果。輸出之列聯相關係數的檢定結果為0.355,且己達到0.05的顯著水準,表示二變項間有關存在。
點二系列相關 在求二個變項相關時,如果一個變項為真正二分名義變項,一個變項為計量(連續)變項(等距或比率變項),統計分析時應採用點二系列相關。 求點二系列相關程序與求積差相關係數的程序相同。 例如:測驗中之『鑑別度指數』就是點二系列相關係數,指受試者在某一試題上答錯或答對的情形與測驗總分之間的相關,『答對或答錯』為一名義二分變項,測驗總分為一連續變項。因此其相關適用點二系列相關。 鑑別度指標表示:就某一試題而言,答對此題的受試者,其測驗總分會較高;答錯的受試者,其測驗總分會較低,表示此試題的鑑別度很高;如果情形相反,答對某一試題者其驗總分較低,答錯者則測驗總分較高,表示此試題的鑑別度很低,鑑別度高低是篩選試題或題目重要準則。 點二系列相關的公式如下:
點二系列相關中,由於有一變項是二分變項編碼,名義變項的編碼方式會影響點二系列相關係的方向。
例題五(點二系相關.sav) 某教師想了解該班學生之數學科成績與性別間有無顯著關係?從班上隨機抽取15名學生,以下為這15名學生的數學成績與性別分配情形,試問該班學生之數學成績與性別有無顯著關係存在? A B C D E F G H I J K L M N O 成績 67 73 90 80 75 60 43 92 68 89 69 85 77 91 50 性別 1 問題中數學成績是一個連續變項,學生性別是一個二分名義變項,二者相關應採用點二系列相關。在spss軟體並無專門獨立處理點二列相關的操作程序,而因為點二系列相關其操作程序可藉用處理積差相關法的方式,因而其spss分析步驟與積差相關統計分析的步驟相同。
斯皮爾曼(Spearman)等級相關 二個變項均為次序變項或可以轉化為次序變項的連續變項,二者相關在於求出其等級間一致性程度。資料建檔時可以直接輸入評分者評定的等級或原始成績,如果是原始成績(為連變項)SPSS運算時會先轉化為等級,再求二個變項間的相關。Spss提供二種求等級相關的方法,一為Spearman等級相關、二為Kendall tau等級相關。 Kendall tau等級相關法通常適用於受試者人數較少的情形。 Spearman等級相關係數的計算公式如下: 其顯著性的檢定公式如下:
例題 (等級相關.sav) 某校語文競賽,二位評審對十名參賽學生評分結果如下表所示。試問二位評審打的分數之等級一致性程度如何? 第一位 90 60 75 65 80 70 95 55 85 50 第二位
無母數相關
研究者可以利用『等級觀察值』將原始資料轉化為等級,查看二位評分者給分的名次情形 上表為Spearman等級相關檢定結果, Spearman等級相關係數為0.564,p=0.09大於0.05未達顯著水準,表示二位評分者評分等級的一致性很低或評分等級的相關程度不高 研究者可以利用『等級觀察值』將原始資料轉化為等級,查看二位評分者給分的名次情形 選『轉換』功能表下之『等級觀察值』次指令 將原始資料轉換為等級方式
實作練習、Spearman等級相關(ex6-6.sav) 有一研究者想知道大學聯招之作文評分是否具有信度,乃隨機抽取二十份作文考卷,下表是每份考卷由二位評分者所給的二個分數。試問大學聯招的作文評分是否具有一致性? 作文編號 A B C D E F G H I J K L M N O P Q R S U 評分者A 31 24 26 15 18 35 17 20 25 30 27 11 評分者B 19 34 22 28 21 29 32
肯德爾(Kendall’s coefficient of concordance)和諧係數 適用於k個變項之等級一致性程度,代表三個以上評分者的信度指標,Spearman等級相關主要用於二位評分者評N個人的成績或作品,或同一位評審者前後二次評N個人的成績或作品,適用於二變項等級間的一致性程度,可以視為Kendall和諧係數的一種特例。Kendall和諧係數適用於k個評分者評N個人的成績或N個人的作品,如果,K=2時就變成Spearman等級相關。 Kendall和諧係數考驗中的統計假設如下:
例題 (肯德爾和諧相關.sav) 某校演講競賽,五位評審對十名參賽學生評分等級結果如下表所示。試問五位評審評審結果的一致性為何? 評分者 V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 A 3 9 8 1 6 4 10 2 5 7 B C D E
Kendall's W 檢定
上表為Kendal’s 和諧係數考驗結果,第一個表為平均數等級結果。以第一位受試者V1而言,五位評審者給予名次等級分別為3、7、3、5、6,整體平均名次等級為(3+7+3+5+6)5=4.80;以V10而言五位評審者給予名次等級分別為7、4、8、7、5,整體平均名次等級為(7+4+8+7+5)5=6.20。 在Kendall和諧係數考驗的統計假設為 Kendall和諧係數值=0.838,卡方值=37.713,顯著性之P值(=0.000)小於0.05,拒絕虛無假設接受對立假設,顯示五位評審者的評分間有顯著相關存在,亦即五位評審者的評分結果頗為一致,其中V8的等級平均數最低為1.40,名次最佳,五位評審的評分分別為2、1、2、1、1。
例、kendll和諧係數(ex6-8.sav) 一項研究想了解某一學會成員選擇參加年會與否的因素,在隨機抽取22名會員後,請他們就八項因素的重要性,以等級加以排列,結果如下表。根據這些資料,除了可以分析各因素的重要性外,也可以了解22名成員的評鑑之一致性如何?試問這項評鑑工作是否具有一致性?(等級數愈小,代表重要性愈高) A B C D E F G H I J K L M N O P Q R S T U V 交通 2 6 1 5 4 3 1.5 氣候 7 8 時間 人 4.5 內容 通知 禮品 匯率
由SPSS所輸出之描述統計結果,可知有效觀察值個數、平均數、標準差、最小值及最大值。其中平均數就是22個評者對八個因素重要性評定之平均等級,由報表可知:factor1(交通)之平均等級為1.80,重要性最高。其次是factor2(內容)之平均等級2.82;最不重要則是factor8(匯率)其平均等級為7.91。
SPSS所輸出Kendall和諧係數的假設考驗結果。由報表可知22樣本對八個因素重要性評鑑之平均等級依序為1. 80、6. 23、4 SPSS所輸出Kendall和諧係數的假設考驗結果。由報表可知22樣本對八個因素重要性評鑑之平均等級依序為1.80、6.23、4.39、3.66、2.82、5.32、3.89及7.91。經檢定結果,Kendall和諧係數值為0.632,轉換為卡方值約為97.325,在自由度為7下,p=0.000己達0.05顯著水準,表示22名樣本對八項因素重要性評鑑的可信性相當一致。
在實證研究中,研究者在比較各因素間的重要性時,常以平均等級或平均分數高低,即對各因素的重要性下結論。 以上例為例:如果研究者對各因素間重要性次序下如下結論:交通(1.8)、內容(2.82)、人(3.66)、禮品(3.89)、時間(4.39)、通知(5.32)、氣候(6.23)、匯率(7.91),事實上如此作法是不可以的,所得到的結論也相當值得懷疑,以人與禮品二因素而言,二者平均等級相當接近,推論說『人』的因素重要性高於『禮品』實在相當冒險。 類似這種比較各因素(變項)間相對重要性的檢定工作,較為可行的作法是,如果變項是等距或等比尺度,使用單因子相依樣本變異數分析進行分析;若變項是屬於次序尺度(如本例)可使用弗里曼二因子等級變異數分析進行分析。 當檢定結果達顯著後,選擇適當事後比較,在確定二因素或變項間的平均分數或等級,確實達到顯著水準後,才下結論二者間的重要性有所不同,否則純粹根據描述統計量進行推論,在研究上將是一件相當冒險的事,以本例人與禮品二因素來看,二者平均等級的差異為0.23,此一差異若檢定未達顯著水準,則必須說二因素間的重要性並無顯著差異,0.23的差異量是機遇造成的。
一致性係數 『Kappa一致性係數』適用於檢定類別變項間一致性程度,如果二個變項均屬於次序變項(變項資料可以排出次序或等級),則變項間的一致性程度可以採用等級相關,等級相關常被用來作為評分者信度指標。如果評分者所評定的資料不能排出次序或等級,只能把它歸類到某一個類別時,應採用『Kappa一致性係數』。 『Kappa一致性係數』公式如下: 為評分者實際評定為一致的次數百分比 為評分者理論上評定為一致的最大可能次數百分比
例(Kappa相關.sav) 有二位教師對國中學生的學習型態作一分類,他們觀察100位國中學生的學習型態,並將其各自歸類,二位教師歸類的結果如下,試問二位教師歸類的一致性為何? 第二位評定者 型態一 型態二 型態三 第一位評定者 23 6 9 7 20 3 8 4
教師一將學生歸類為型態一者有38位,在這38位中教師二將其歸類為型態一者有23位;教師一將學生歸類為型態二者有30位,在這30位中教師二將其歸類為型態二者有20位;教師一將學生歸類為型態三者有32位,在這32位中教師二將其歸類為型態三者有20位
上表為卡方檢定結果,卡方值等於42. 126,df=4,p=0. 000<0
上表為對稱性量數考驗結果,Kappa一致性係數等於0. 442,p=0. 000<0 上表為對稱性量數考驗結果,Kappa一致性係數等於0.442,p=0.000<0.05,達到顯著水準。應拒絕虛無假設H0:K=0,即二位評定者對於學生學習型態的歸類一致性程度相當高。
淨相關 淨相關(partial correlation)是指一組雙變數變項同時與第三個變項有關係存在,當我們排除第三個變項的影響後(即控制第三個變項的影響),這一組雙變數之間的關係,又稱為『偏相關』。 在社會科學研究裡,有時研究者發現兩個變項之間有某種關係存在,但實際上這兩個變項間的相關很可能是透過第三個變項造成,如果把這第三個有顯著相關的變項去除後,則前述二個變項間的相關可能很低。 沒有控制變項,亦即沒有排除其它變項的影響,則此淨相關稱為『零階淨相關』,通常指的是二個變項沒有排除其它變項之簡單相關(積差相關)。 控制變項有一個,亦即排除一個變項的影響,則稱此淨相關為『一階淨相關』
一階淨相關
二階淨相關 控制變項有2個則稱為『二階淨相關』,即第一與第二變項中同時排除第三與第四個變項之解釋力之後,第一與第二變項間的純相關。 控制變項有三個,即同時排除的變項有三個,則稱為『三階淨相關』。 控制變項有四個,則稱『四階淨相關』 淨相關的自由度=樣本總數-2-控制變項數。通常淨相關之值會小於簡單相關之值。
Spss操作 開啟『分析』功能表之『相關』下之『偏相關』指令之對話方塊。 界定所要進行淨相關係數計算之變項名稱,從來源清單中選取後移至『變數』方格中。 點選做為控制的變項,並移至『控制的變數』方格中。 依假設之性質選定『單尾』或『雙尾』檢定。 選取『選項』次指令,選取『平均數與標準差』以及『零階相關』(即積差相關)二種選擇。 完成界定後按確定鈕。
例6-2(資料檔為BANK.SAV) 有一研究想要了解企業474名員工在起薪與目前薪資的相關,但同時發現起薪與目前薪資都與任職年資有相關存在,為精確了解起薪與目前薪資之相關程度,決定計算起薪與目前薪資的淨相關。 請問在任職年資的因素剔除後,起薪與目前薪資間是否有顯著的相關?
部分相關 又稱『半淨相關』,假設X1、X2、X3,如果X1與X2二個變項同時排除X3變項的影響力後,則X1與X2二者的相關即是淨相關,淨相關是將第三個變項的解釋力自二個變數中同時去除。而部分相關則是將第三個變項自其中的一個變數中去除,如從X2中排除變數X3的解釋力後(以X(2.3)符號表示),變數X1和變數X(2.3)的相關,即是所謂的部分相關或半淨相關。