無母數統計檢定 (Nonparametric Tests) 主持人:謝邦昌 教授
演講主持人 謝邦昌 教授 學歷 國立臺灣大學農藝所 生物統計組博士 主要經歷 現任:輔仁大學統計資訊學系暨應用統計所 教授 謝邦昌 教授 學歷 國立臺灣大學農藝所 生物統計組博士 主要經歷 現任:輔仁大學統計資訊學系暨應用統計所 教授 中華資料採礦協會 理事長 中國統計學社 理事 曾任:輔仁大學進修成長學院院長 輔仁大學總務長 中華資料採礦協會秘書長 南開大學資訊科學與概率統計顧問 輔仁大學統計系系主任
大綱 有母數與無母數統計方法之比較 無母數統計方法彙總比較表 Spss17.0無母數的功能介紹
有母數與無母數統計方法之比較 比較 方法 有母數統計 無母數統計 適用對象 常態母體 非常態或未知母體 推論對象 母體參數 比較 方法 有母數統計 無母數統計 適用對象 常態母體 非常態或未知母體 推論對象 母體參數 非母體參數(適合性、獨立性、一致性之檢定) 適用尺度 等距、比率 名目、順序、等距或比率 優點 在等距或比率尺度時,其準確度較高。 母體已知時,效率較高。 小樣本下,準確度較高。 無需假設母體為常態,因此應用較為廣泛。 各種尺度皆為適用。 計算簡單且快速。 在小樣本時特別適用於非常態母體。 缺點 需假設母體為常態,因此應用較有限。 無法適用於名目與順序尺度。 在等距或比率尺度時,其準確度較低。 因樣本較小,檢定誤差相對較高。 母體已知時,效率相對較低。
無母數統計方法彙總比較表
SPSS17.0無母數的功能介紹 卡方分配 二項式 連檢定 單一樣本K-S檢定 二個獨立樣本 K個獨立樣本 二個相關樣本 K個相關樣本
一、單一樣本卡方檢定法 (One-Sample Chi-Square test) 無母數的卡方檢定乃為單一樣本卡方檢定。 此處的卡方檢定乃是檢定類別變數所在母體分配是否與已知的母體分配一致。 這種適合度檢定,會比較各類別中的觀察次數和期望次數,以檢定是否所有類別都包含相同的數值比例,或各類別都包含使用者指定的數值比例。
例子-卡方分配 擲一骰子600次,得下列結果: 試問此骰子是否為一公正骰子? H0:P1=P2=…=P6=1/6 點數 1 2 3 4 5 6 次數 80 120 140 90 70 100 H0:P1=P2=…=P6=1/6 H1: P1,P2,…,P6不全相等
顯著性小於0.05,拒絕H0,表示在α=0.05下,有足夠證據顯示此骰子不為一公正骰子。 次數需要加權觀察值 顯著性小於0.05,拒絕H0,表示在α=0.05下,有足夠證據顯示此骰子不為一公正骰子。
二、二項式檢定法(Binomial test) 二項式檢定是用來判斷分配值是否是二項分配。 將二分變數兩個類別的觀察次數,跟具有特定機率參數的二項式分配之下的期望次數,互相作一比較。
從圖中可以看出女生的觀察比率(Observed Prop. ) 是0. 47未達顯著水準(Sig=1 因為「電腦能力」因為是三群,故無法進行二項分配檢 定,除非在對話框中先設定分割點。
三、連檢定法(Runs test) 連檢定法是用來檢定變數中,兩數值的發生順序,是否為隨機。 若1表示漲,0表示跌,則觀察20天股票市場,所得到的結果是11110111001110001011,是否為隨機分配? 連(Runs)是指連在一起的相同數值,如果樣本所含的連數太多或者太少,就代表該樣本不是隨機的。
例子-連檢定法 如果甲、乙兩人比賽一場乒乓球,共計36球,每球甲贏時以1表示,輸時則以0表示,比賽結果成績順序如下: 1110001110000110011101011010011011101 甲、乙每球比賽輸贏的次序是否有隨機性? H0:具隨機性 H1: 不具隨機性
三個顯著性都大於0.05,不拒絕H0 ,即在α=0.05下,甲乙比賽具有隨機性。
四、單一樣本檢定法 (One-Sample K-S test) 單一樣本檢定法或稱為Kolmo-Smirnov One-Sample Test是用來檢定某變數是否符合指定的理論分配。 如是否符合常態分配、均等分配(Uniform)、Poisson分配與指數分配(Exponential)等。
例子-單一樣本檢定法 觀察120天,每天醫院的急診人數,如下: X是否服從Poisson分配? H0:X服從Poisson分配 觀察次數(天) 9 1 12 2 30 3 27 4 22 5 13 6 7 H0:X服從Poisson分配 H1:X不服從Poisson分配
顯著性大於0.05,不拒絕H0 ,即在α=0.05下,X(急診人數)服從Poisson分配。
五、兩獨立樣本檢定 (Two Independent Samples test) Mann-Whitney U檢定法(M-W法)類似有母數的T-test,可用於檢定兩組樣本所來自於的母體是否具有相同的中位數,或是否來自於同一母體;亦可用於檢定兩樣本所來自的母體是否具有相同的變異程度。 其理論基礎乃認為,如兩樣本來自於相同的母體,若將兩組樣本混合,自最小值到最大值排列,則兩組觀察值會交錯排列,否則會各占一邊。 Kolmogorov-Smirnov Z(K-S法)兩樣本檢定法是檢定兩組樣本是否出自於同一個母體,兩母體是否具有相同的比例結構,亦可代替卡方檢定而作獨立性檢定與齊一性檢定。
例子-兩獨立樣本檢定 一個班級有18位學生,把18位學生分成兩組,一組8位學生,另一組10位學生,以下各是每位學生的考試成績,檢定兩組學生成績是否有差異。 一 95 66 42 82 71 68 52 86 二 49 39 80 65 30 62 53 55 60 H0:兩組學生成績相同 H1:兩組學生成績不同
顯著性小於0.05,拒絕H0 ,即在α=0.05下,兩組學生成績有顯著不同。
六、K組獨立樣本檢定 (K Independent Samples test) 兩組獨立樣本檢定法經由Kruskal與Wallis加以推廣為「K組獨立樣本檢定」,並提出Kruskal-Wallis H檢定法,用以檢定K組獨立樣本是否具有一致的母體。 與此方法相對應的有母體統計方法是One-way ANOVA。 H檢定法是先將K組樣本的所有觀察值按由小到大的順序排序,並給予適當的等級,如有相同的觀察值,則加總其相當的等級,並加以平分之以代表,並計算H統計量,它將形成卡方分配。 中位數Median(檢定法)亦可檢定K組獨立樣本所來自的母體是否具有相同的中位數。
例子-K組獨立樣本檢定 廣三公司的人事經理,想要研究三種不同訓練計畫對其業務員之銷售能力是否有顯著影響。今選擇能力大致相同之18名業務員,隨機指定接受三種訓練計畫中之某一種,幾月後,各業務員之銷售金額如下: 一 二 三 32 45 37 29 28 50 48 51 47 41 25 42 30 39 34 46 52
例子-K組獨立樣本檢定 檢定三訓練方法是否有差異? H0:η1=η2=η3 H1: η1,η2,η3不全相等
顯著性大於0.05,不拒絕H0 ,即在α=0.05下,無證據顯示三種訓練計畫有差異。
七、二個相關樣本檢定 (Two Related Samples test) 符號檢定(Sign Test)或Wilcoxon符號等級檢定(Signed Ranks Test)可用於檢定兩個有關樣本所來自母體的中位數是否有顯著差異。 假設每對觀察值的差數乃是隨機產生的,將D值由大到小排序,然後將所有負號的等級相加及平均。 D的符號為正或為負的機率相等,均為1/2,若正號與負號出現過多或過少,則代表兩個有關樣本的平均數有顯著差異。
例子-二個相關樣本檢定 隨機抽取8名學生,得其統計學之期中考及期末考 成績如下: 當母體的分配未知時,應如何進行「期末考是否有進步」之檢定? 1 2 3 4 5 6 7 8 期中考 82 99 87 70 55 75 80 期末考 90 93 96 62 60 71 79 85 H0:η1>=η2 H1: η1<η2
由符號檢定和Wilcoxon符號等級和檢定得知,顯著性大於0.05,不拒絕H0 ,即在α=0.05下,沒有顯著的進步。
八、K組相關樣本檢定 (K Related Samples test) Friedman檢定可用於檢定K組有關樣本所來自母體的中位數是否有顯著差異。 與其相對應的有母數統計方法是One-way ANOVA。 但Friedman是使用變數的等級平均數而不是使用原始數據的平均數與標準差。 且Friedman是利用卡方分析比較等級值和期望值,而不是算出F值。
例子-K組相關樣本檢定 某電腦專賣店想要研究購買者對不同品牌是否有偏好,乃邀請6位購買者,針對四種不同品牌給予評分,而四種品牌的評定順序,乃是以隨機方式給予購買者評定,資料經整理後發現,各購買者之評定等級如下: 購買者 品牌 A B C D 1 2 4 3 5 6
例子-K組相關樣本檢定 檢定四種不同品牌電腦在購買中是否有偏好? H0:η1=η2=η3 H1: η1,η2,η3不全相等
由Friedman檢定得知,顯著性大於0.05,不拒絕H0 ,即在α=0.05下,無證據顯示購買者對四種不同品牌電腦有偏好。
Thanks !