第十四章 研究的綜合﹙統合分析﹚ 報告人:許景林 曾威誠
統合分析(meta-analysis) 這是一種研究的綜合之技巧,可以將許多不同研究的結果予以量化及標準化,並使用統計技巧來做為分析的工具。
有時候「文獻探討」 (literature review),亦稱「文獻回顧」,其本身就是一篇研究的文章;如果以專門的術語來說,就是「研究的綜合」(research synthesis)。 研究的綜合之作用不只是相關文獻參考資料的整合,它反而是一個具有邏輯性的研究型態,可引導出正確的結論、假設的檢驗,以及理論的修正或建議。
進行研究的綜合之方法和進行任何其他類型的研究都是一樣的,研究者必須很清楚地呈現出研究的步驟。 一般研究的綜合,通常都沒有回答下列重要的問題: 1.文獻參考資料的蒐集夠完整嗎? 2.在撰寫評論時,某些文獻參考資料會被使用,而某 些會被捨棄,取捨的理由是什麼? 3.研究者如何提出一個特定的結論?
統合分析之目的 如同其他的研究步驟一樣,統合分析也需要先選擇一個想要進行研究的重要問題,然而,統合分析比先前研究的綜合多出兩個步驟:第一,將研究的綜合所使用的研究方法予以明確化;第二,將不同的研究結果予以量化,成為一個標準的共同比較單位,稱為「效果量」(effect size, ES),使不同研究有了共同的單位之後,才能使用統計技巧當作分析工具。
統合分析的基本步驟如下: 1.界定研究問題。 2.藉由特定的方法來搜尋參考文獻。 3.閱讀蒐集到的參考文獻,決定研究的取捨。 4.謹慎地閱讀和評估參考文獻,以便對於重要的研究特性進行確認和編碼。 5.計算出「效果量」。 6.使用適當的統計分析方法。 7.在提出研究的綜合之研究報告中,說明所胝上述的步驟以及取得的結果。
效果量以ES或符號△表示,它是一種判斷組間差異意義的方法。 ES=(ME – MC)/sC ME:實驗組的平均數 MC:控制組的平均數 sC:控制組的標準差
統合分析之應用實例 由知覺動作訓練的統合分析研究結果得知,知覺動作訓練幾乎是不具有任何訓練效果的。 由性別的最大耗氧量差異之統合分析研究結果得知,性別的最大耗氧量差異主要是由於身體組成的差異所造成,而與其他生理機轉的差異較沒有關係。 此外,運動也顯示對膽固醇和其他成分的改變具有正面的影響效果。
統合分析之應用實例(續) 此外,有心智練習比沒有任何心智練習來得好,但是差異不大。 再者,青春期之前,性別在運動技能表現上之差異似乎主要是由環境因素所造成的;但是在青春期之前,生物有機體的天生差異在投擲這項運動項目表現上則扮演著一個相當重要的角色。 最後,社會影響與個人參與運動之間有正相關存在,但是大部分為低度至中度的正相關。
如果將統合分析做適當運用,而且對研究結果謹慎解釋,那麼它可以說是一種能夠將大量的研究資料歸納簡化成基礎原理、原則的一種好方法。這些原則將可成為研究計畫發展、未來研究、理論考驗,與多種實務應用的基礎。
統合分析的注意事項 統合分析將不同的測量尺度、研究方法,以及研究設計所得到的研究發現組合在一起,就好像是把蘋果和橘子混在一起。 Hedges(1981, 1982a, 1982b)以及Hedges與Olkin(1983, 1985)已經將Glass(1997)原先的方法做了衍伸,並提出一套新的技巧及統計考驗,特別設計用以強調下列統合分析的問題與批判:
1.哪些變數需要加以編碼?編碼的過程為何?如何將已經編碼過的資料予以組織起來? 2.當在計算效果量(ES)的時候,該以哪一個變數來做為標準差? 3.由於樣本的效果量(ES)是母群體效果量(ES)的一個偏誤估計值,該如何校正這個偏誤呢? 4.需要根據樣本數大小來對效果量(ES)做加權處理嗎? 5.所有樣本的效果量(ES)都是來自於同一個母群體的效果量(ES)嗎? 6.哪些統計方法對分析效果量(ES)來說是適當的? 7.如果一個樣本的效果量(ES)包含了離群值,該如何將它找出來?
(一)哪些變數需要編碼? 想要在選擇編碼項目和發展編碼計畫上一舉成功的最好方式,除了要知道統合分析的步驟之外,還要對你想要進行統合分析的相關理論與實證文獻有所了解。 有時候特定的資訊必須加以保留,舉例來說,如果每個研究之參與者平均年齡是很重要的話,則可將這個平均年齡列入編碼。
﹙二﹚選擇效果量﹙ES﹚的標準差 當使用效果量﹙ES﹚來比較一個實驗組和一個控制組,且這兩組的變異數不相等時,就利用控制組的標準差來計算所有研究的效果量﹙ES﹚。但是,如果是在缺少控制組的情況下,使用效果量﹙ES﹚來比較兩組﹙例如:不同年齡或不同性別﹚之間的差異,我們認為由Hedges﹙1981﹚所建議的加權合併估計值是最佳的。
Hedges﹙1981﹚ 所建議的加權合併估計值 (NE - 1)SE2 + (NC - 1)SC2 SP = NE + NC – 2
﹙三﹚計算受試者內實驗設計的效果量﹙ES﹚ 由於研究者常要計算受試者內實驗設計(within-subjects design)的效果量(ES),這種實驗設計通常是比較前測與後測的差異,來考驗一個實驗處理的效果(例如:實驗組)。計算這個效果量(ES)的適當公式就是使用前測的標準差,對於未經過實驗處理的變異數而言,這是避免將前測和後測的平均值之差異予以標準化之最佳代表方式。
﹙四﹚使用效果量(ES)做為實驗處理效果的估計值 Hedges(1981)指出,小樣本的效果量(ES)一定會有偏誤的,但是當樣本數超過20的時候,偏誤就會降至20%,或甚至更低。為了得到一個真正的效果量(ES)不偏估計值,可以將效果量(ES)乘以下列公式中的校正係數(correction factor, c): 3 c =1 - 4m - 9
每一個效果量(ES)在被平均或是進一步分析之前,都應該加以校正。如果每一個效果量(ES)在被平均之前沒有加以校正的話,那麼即使是由很多的效果量(ES)加以平均,仍然是有偏誤的,因為它只是對於一個不正確的數值,加以更精確地計算而已。
Hedges(1981)指出,效果量(ES)的變異數可以直接由下列公式計算出來: NE + NC ESi2 var[ESi] = + NENC 2[NE + NC] NE :實驗組的樣本數﹙第一組﹚ NC :控制組的樣本數﹙第二組﹚ ESi:效果量(ES)的估計值
﹙五﹚同質性檢定 同質性統計(H),是特別設計來考驗虛無假設,H0:ES1=ES2=‥‥=ESi,這個虛無假設的意思是說:所有個別的效果量(ES)都是來自於有同樣效果量(ES)的一個母群體。
﹙六﹚變異數分析與加權迴歸 用來檢驗效果量(ES)之解釋模式(explanatory model)的方法。
﹙七﹚離群值的考驗 在迴歸模式中,偏離平均值太多的效果量(ES)可以藉由檢查迴歸方程式的殘差(residual)加以分辨出來,而殘差的絕對值則可以透過減去平均值再除以標準差的方式,予以標準化成為z分數。 經過將殘差標準化之後的效果量(ES),如果它的值大於2,通常會被認為是具有偏離平均值太多的潛在可能性,因為它們已超出95%的常態分配範圍。
﹙八﹚研究在發表時產生的偏誤 Hedges與Olkin(1985)提出一種技術,用來估計有多少篇未發表的研究,且其研究結果為研究變數之間並無顯著影響或效果存在;意即應該要將這些研究的效果量(ES)平均值減低到不具重要性才對。 K0=[K(dES mean – dES trivial)]/dES trivial K0 =需要把效果量(ES)降低的研究篇數。 K =使用統合分析的研究篇數。 dES mean =在統合分析研究中,所有效果量(ES)的平均值。 dES trivial=沒有達到顯著差異水準的效果量(ES)估計值。
總 結 近年來,統合分析的研究技巧已經被廣泛地使用在各種學術領域,當然也包括體育研究。統合分析是一種可以將極大數量的研究,歸納簡化為一種基礎原理、原則的工具。進行統合分析研究時,有許多注意事項必須加以考量,例如:選擇標準差以計算效果量(ES)、樣本偏差的效果量之加權、離群值考驗,與分析過程中所需使用的統計步驟…等都是需要不斷加以改善的。
報 告 完 畢 謝 謝