統計方法的概念與應用 一、認識統計(statistics)、測驗(test)、 測量(measurement)與評價(evaluation) 二、統計方法的選用 三、研究上一些常用的統計方法 四、適當統計方法的選擇
一、認識統計、測驗、測量與評價 測驗的意義為一組標準化待解答的問題 (一)常模(使用測驗者解釋測驗結果或分數的依據) (二)信度(一致性、可靠性與穩定性) (三)效度(一個測驗能真正測量到它所要測量的特質)。以上三者為測驗編製程序的標準化 (四)測驗實施的程序與記分的方法。
(二)、測量 指給分的過程,測量的結果得到時間、距離、次數或分數。指任何可以獲得數值的工具,是一種收集資料的過程。
(三)、評價 根據測量所得結果而做的判定或解釋觀察所得的結果。
(四)、統計 統計學是應用機率理論與事實的數字,描述、組織、綜合、分析和解釋量的資料的方法或程序,並由此過程藉以發現各現象之真理原則等之學問。
二、統計方法的選用 描述性統計:將測驗所得的原始分數加以分類,描述和劃記等方法,將一群資料加以整理,摘要和濃縮,俾便容易了解其中所含的意義和其中所傳遞的訊息性質之方法。 推論性統計:依據得自樣本的資料以推測母群體的性質並陳述可能發生的誤差之統計方法。
三、研究上一些常用的統計方法 (一)積差相關(product-moment correlation) (二)獨立樣本t 考驗(t-test, independent samples (三)重複量數t考驗(相依樣本t 考驗)(t-test, repeated measures; t-test, correlated samples) (四)獨立樣本單因子變異數分析(one-way ANOVA, independent samples) (五)重複量數單因子變異數分析(one-way ANOVA, repeated measures)
三、研究上一些常用的統計方法(續) (六)獨立樣本二因子變異數分析(two-way ANOVA, independent samples) ANOVA, mixed design) (八)重複量數二因子變異數分析(two-way ANOVA, repeated measures) (九)變異數同質性考驗(test of homogeneity of variance)
三、研究上一些常用的統計方法(續) (十)杜凱法事後比較(Tukey method) (十一)薛費法事後比較(Scheffes method) (十二)共變數分析(analysis of covariance; ANCOVA) (十三)2考驗(2 test) (十四)多元逐步迴歸分析(multiple stepwise regression analysis)
三、研究上一些常用的統計方法(續) (十五)多元同時迴歸分析(multiple simultaneous regression analysis) (十六)多元階層迴歸分析(multiple hierarchical regression analysis)
四、適當統計方法的選擇 比率量尺 一般而言,為了統計分析 (有絕對零, 距離、 方便起見,研究者可以將 時間、 重量) 等距量尺 (評定量表與教育測驗得分等) 次序量尺 (百分比、 常模、 社會階級、 名次) 類別量尺 (性別、 宗教、 國籍) 一般而言,為了統計分析 方便起見,研究者可以將 較高層次的資料轉換成較 低層次的資料,如將比率 或等距資料轉化為次序或 類別資料,或將次序資料 轉化為類別資料。但是, 無法將低層次的資料轉化 成高層次的資料。
四、適當統計方法的選擇(續) 比率或等距資料適用於母數統計考驗方法,而類別和次序資料則適用於無母數統計考驗法。 實際選擇適當的統計方法時,研究者考須先確定自變項及依變項是屬於何種資料類別,然後再確定自變和依變項的數目,根據這兩項資料可選擇適當統計分析方法。
(一)積差相關(product-moment correlation) 使用目的:了解兩個變數之間關係密切的程度。 使用時機:適用於兩個連續變數。 例子:同一組人其智力和學業成績之間的相關。
(二)獨立樣本t 考驗 使用目的:兩個平均數的差異考驗。 使用時機:用在兩個互為獨立的母群的差 異比較。 例子:比較男、女選手學習動機得分的差 異。
(三)重複量數t考驗(相依樣本t 考驗) 使用目的:兩個平均數的差異考驗。 使用時機:用在一個母群中兩次得分的差異比 較(或是配對組、雙胞胎得分的差異比較)。 例子:同一組人前、後測得分的差異比較;同一組人在紅光和綠光反應時間的差異比較(或是將相同I.Q.的受試者配對然後做某種特質的差異比較;雙胞胎在紅光和綠光反應時間的差異比較。此種相依樣本雖然不是同一個人,但因配對的關係或是雙胞胎的關係,亦可視為同一個人,此即相依樣本。)
(四)獨立樣本單因子變異數分析 使用目的:比較三個(含)以上的平均數的差異。 使用時機:用在三個(含)互為獨立的母群的差異比較。 例子:比較循環訓練法、間歇訓練法及重量訓練在肌耐力效果上的差異。
(五)重複量數單因子變異數分析 使用目的:比較同一個群體三個(含)以上的平均數的差異。 使用時機:同一個群體,每個受試者都有三次(含)以上的得分。 例子:比較某個實驗組在紅光、綠光及黃光反應時間的差異(每個受試者都必須做紅光、綠光及黃光的反應時間)。
(六)獨立樣本二因子變異數分析 使用目的:了解兩個自變項(或屬性變項、類別變項)對於某個依變項(觀察變項)交互作用的影響。 使用時機:當有兩個因子時,且這兩個因子互為獨立,若要了解其對某個觀察變項有何交互作用的影響時,可使用此項統計方法。 例子:想要了解A、B兩種藥品在使用不同的劑量(輕、重)時對於治療高血壓是否有交互作用影響。
(七)混合設計二因子變異數分析 使用目的:了解兩個自變項(或屬性變項、類別變項)對於某個依變項(觀察變項)交互作用的影響。 使用時機:若有兩個因子,其中一個是獨立樣本(如男、女;或有、無回饋),另一個為重複量數(如每一個受試者均接受紅光、綠光、黃光反應時間的實驗處理),想要了解其對某個觀察變項有何交互作用影響。 例子:了解有、無回饋是否對於不同色光(紅光、綠光、黃光)的反應時間有所影響。有回饋組和無回饋組的受試者,每人都必須對三種色光做反應。
(八)重複量數二因子變異數分析 使用目的:了解兩個自變項(或屬性變項、類別變項)對於某個依變項(觀察變項)交互作用的影響。 使用時機:若有兩個因子,皆為重複量數,想要了解其對某個觀察變項有何交互作用影響。 例子:想要了解釘鞋的釘子長短和起跑架的角度對於100公尺短跑速度的影響,其中每個受試者均需穿長短不同的釘鞋,並使用不同角度的起跑架(一種是60度,另一種是45度)各跑一次100公尺。
(九)變異數同質性考驗 使用目的:想要了解各個群體之間的變異數是否同質。 使用時機:在做獨立樣本的差異性比較時,都需先做此項考驗。若各個群體的變異數不同質,則所得的結果將和實際的結果有所不同。 例子:如在進行獨立樣本t 考驗、獨立樣本單因子、二因子、多因子的變異數分析之前,都需先做此項考驗,等確定各組都同質時,才可進行差異性的比較。
(十)杜凱法事後比較 使用目的:確認那兩組之間有差異存在。 使用時機:當各組人數相等,而且變異數分析達到顯著水準時(當計算的F值<.05時),進一步確認何組之間有差異存在。 例子:啟發式教學法、演講式教學法及欣賞式教學法在人數相同的實驗組所產生的教學效果其差異若達顯著時,需進一步比較何組之間有差異存在。
(十一)薛費法事後比較 使用目的:確認何組之間的平均數有差異存在。 使用時機:當各組人數不等,而且變異數分析達到顯著水準時(p<.05時),進一步確認何組之間有差異存在。或是不同合併組進行差異比較達顯著水準時。 例子:啟發式教學法、編序教學法、演講式教學法、欣賞式教學法在人數不同的實驗組所產生的教學效果其差異達顯著水準時,需進一步比較何組之間有差異存在。
(十二)共變數分析 使用目的:將會影響數個自變項的某一個變數抽離出來,以便比較這數個自變項對依變項的影響。 使用時機:當無法做到實驗控制時,而且發現某個變數會影響到此項實驗,就以統計控制的方法將此變數控制住(從自變項中抽離出來),然後比較這數個自變項對依變項的影響。 例子:在三個智力不同的班級實施不同的教學法,看其學習效果是否有所不同。因無法將三個班級打散隨機編班(亦即無法做到實驗控制),因此只好將智力的因素先加以排除,然後才比較三個班的學習效果。
(十三)2考驗 使用目的:可用在(1)適合度考驗(在單一向度中,就某一變項考驗其觀察次數是否與其期望次數相符合);(2)百分比同質性考驗(考驗研究者所感興趣的J個群體在I個反應的百分比是否一樣);(3)獨立性考驗(考驗兩個變項之間是否互為獨立);(4)改變的顯著性考驗(用來考驗同一群受試者對同一事件前後兩次反應之間的差異情形)。 使用時機:適合用在間斷變數(如人數)的統計。
(十三)2考驗(續) 例子:(1)適合度考驗(test of goodness of fit):考驗體研所的研究生對於四個組喜歡的人數是否有所不同。(2)百分比同質性考驗(test of homogeneity of proportions):想了解運動選手、家長、裁判對於服用禁藥的反應(包括贊成、沒意見、反對),其中贊成的百分比是否相同。(3)獨立性考驗(test of independence):了解性別和學習動機之間是否互為獨立(亦即想驗証性別和學習動機之間是否有所關聯)。(4)改變的顯著性考驗(test of significance of change):了解學生在學期初和學期末對體育統計喜歡的人數是否有所不同。
(十四)多元逐步迴歸分析 使用目的:主要是用在探討那些變項較能有效預測某個效標變項。 使用時機:在不確定那些預測變項較能有效預測某個效標變項時,可將這些預測變項用多元逐步迴歸分析的方式篩選出較具預測力的變項。一般多用在探索性的研究方面。 例子:想了解學生的肌力、肌耐力、柔軟度、心肺功能、身體組成、爆發力、反應時間、自我效能、成就動機、教師的教學態度與教師的期望等變項,究竟是那些變項較能有效預測其學習表現。
(十五)多元同時迴歸分析 使用目的:主要是了解所選出的預測變項對於某個效標變項的聯合預測力。 使用時機:當某些預測變項已被確定對某個效標變項有相關時,可將這些預測變項同時投入迴歸模式中,看其對效標變項的變異量可以解釋多少百分比。若解釋的百分比越多,則表示這些預測變項對此效標變項有較大的預測力。但在做多元迴歸分析時,必須考慮預測變項之間是否有共線的情形(若預測變項之間有中度以上的相關,就有可能產生共線。若是有共線的情形,兩個變項就要選擇高的預測變項保留下來,另一個則予以剔除。) 例子:以三分球、二分球、罰球、防守籃板球、進攻籃板球、阻攻、助攻、抄截、犯規、失誤等籃球十項攻防技術來預測籃球比賽的得失分。
(十六)多元階層迴歸分析 使用目的:主要是了解所選出的預測變項對於某個效標變項的聯合預測力。 使用時機:當某些預測變項已被確定對某個效標變項有相關時,可將這些預測變項同時投入迴歸模式中,看其對效標變項的變異量可以解釋多少百分比。但投入迴歸模式的順序並不是根據預測變項和效標變項相關的高低,而是建立在理論的基礎上。多元階層迴歸分析亦需注意共線性的診斷。
(十六)多元階層迴歸分析(續) 例子:以成就動機、目標接受和目標難度來預測後測分數,由於成就動機是屬於人格特質的一種,是人類比較穩定的特質,因此就第一個投入迴歸模式裡;目標接受是一個人對於所分派的目標接受的程度,是屬於一個人的態度,由於態度較會受外界的影響,不是一種穩定的特質,因此第二個投入;目標難度是由實驗者所分派給受試者的目標,是屬於實驗者操弄的變項,此為受試者自己無法控制的變項,因此最後一個投入。多元階層迴歸分析和多元同時迴歸分析在統計方法上非常類似,只是前者必須按預測變項的特質指定進入的順序。