Download presentation
Presentation is loading. Please wait.
1
張偉豪 三星統計服務有限公司執行長 Amos 亞洲一哥
玩弄多變量於股掌 張偉豪 三星統計服務有限公司執行長 Amos 亞洲一哥
2
Ye 教授 開示
3
統計學基礎很爛,可能聽得懂嗎?
4
你會唱歌吧 但是你懂樂理嗎? 你會開車吧 但是你懂汽車構造嗎?
5
大綱 統計方法的 組合運用 分析方法的基本分類 認識統計方法
6
統計方法的分類 類別變數 連續變數 敘述性統計 複選題分析 (多重)交叉分析 卡方 (同質、獨立、適合度)檢定 因素分析 集群分析 相關分析
二元羅吉斯迴歸 區別分析 偏相關分析 迴歸 (路徑)分析 (多變量)變異數分析 典型相關 無因果關係 有因果關係
7
SPSS的統計應用 有母數分析 敘述統計 推論統計 (多變量分析) 無母數分析 質化研究 量化研究
8
敘述統計 推論統計 有母數分析 無母數分析 次數分配表 交叉分析 多重交叉分析 複選題分析
9
敘述統計 推論統計 項目分析(t 檢定) 信度檢定 變異數分析(ANOVA) 多重比較(差異分析) 多變量變異數分析(MANOVA)
有母數分析 無母數分析 項目分析(t 檢定) 信度檢定 變異數分析(ANOVA) 多重比較(差異分析) 多變量變異數分析(MANOVA) 相關分析 迴歸分析 路徑分析(多個迴歸分析) 典型相關 羅吉斯分析(logistic) 集群分析 區別分析 因素分析
10
卡方分析 同質性檢定 適合度檢定 獨立性檢定 結果最好是don’t reject 敘述統計 推論統計 母體 有母數分析 無母數分析 樣本
11
連續 MANOVA 路徑分析 ANOVA t檢定 迴歸分析 (偏)相關分析 不連續 連續 羅吉斯分析 敘述統計 卡方分析 不連續 區別分析
Y(依變數) 典型相關 MANOVA 路徑分析 ANOVA t檢定 迴歸分析 (偏)相關分析 不連續 連續 X (自變數) 羅吉斯分析 敘述統計 卡方分析 不連續 區別分析
12
人口統計變項肯定為 x ,其餘構面視其位置而定;形成某構面的題目可視為該構面之 xn
y 疑問??? ????? 到底何者是x、何者是y呢? 依照箭頭的方向來決定y,箭尾為x 人口統計變項肯定為 x ,其餘構面視其位置而定;形成某構面的題目可視為該構面之 xn A B M Y
13
因素分析主要的功能 建立量表的建構效度。 簡化測量的內容。 用來協助測驗編製, 進行項目分析, 檢驗試題的優劣好壞。 收斂效度及區別效度。
F1 F2 x1 x2 x3 x4 x5 x6
14
集群分析(針對人群分類) 目的 分析工具 集群分析(cluster analysis)分組完後,可用區別分析驗證之
將資料分成幾個相異性最大的群組,而群組內的相似程度最高。 分析工具 二階段集群分析 200個樣本以內採階層式集群分析 (實務上100個判斷就有問題了) 200個樣本以上採 K-means 集群分析(cluster analysis)分組完後,可用區別分析驗證之
15
樣本大小決定 經驗:以問卷中最大的構面中的題項數目為主,以5~20倍為抽樣數目,依母體大小決定之(multivariate data analysis, 5th ed., Hair, Jr. et al., p.98~99)。 計算:
16
問卷發展流程 驗證式分析 問卷產生 預試 因素分析 信度分析 問卷完成 項目分析 探索式 分析
17
問卷發展流程 理論基礎及研究目的 半、開放式問卷 多重選擇式問題 編擬及修訂量表初稿 二分法問題 選取受試者預試 選40~60員進行預試
t 檢定 刪除決斷值(CR)未逹顯著之題項 項目分析 CR值顯著題項 正式量表
18
預試(pretest) 目的: 可供應用的統計方法: 了解問項題意是否清楚及修正錯字等 刪除不具鑑別力的題項,來提升問卷品質
次數分配(檢查有無輸入錯誤或遺漏值) 項目分析(刪除不具鑑別力的變數) 因素分析(縮減變數的數量以利分析進行) 信度分析(求得因素之內部一致性)
19
一般統計方法運用的方式 資料建檔(用excel建檔) 檢查資料(檢查資料輸入是否有誤) 遺漏值處理 刪除資料(tip:由後往前刪)
項目分析(問卷搜集完後) 目的:減少題項,找出有鑑別力的題目 因素分析(探索式) 目的:再度縮減題項,並根據預試資料作初步的信度分析。
20
統計分析流程 驗證式分析 探索式分析 問卷回收 ,key in 資料檢查 因素分析 寫結論 選擇統 計方法 信度分析
21
t 檢定(t-test) 平均數的差異考驗 雙母群考驗
如果研究者想同時考慮不同情況之下的平均數是否有所差異,例如男生與女生的平均數的比較,此時即牽涉到多個平均數的考驗;不同的平均數,代表背後具有多個母數的存在,因此被稱為多母數的平均數考驗。
22
變異數分析—ANOVA 平均數差異檢定:基本原理是計算兩個數值以上(平均數)之間的差異,如果差異夠大,大於統計上的隨機差異,便可能獲得顯著的結果,拒絕虛無假設、接受對立假設。平均數差異與隨機差異的比值,決定了統計的顯著與否。
23
多變量變異數分析(MANOVA) 在變異數分析中,如果要同時考驗數個依變項,且具中度相關,則採用MANOVA。
MANOVA是ANOVA之擴展,當依變數有兩個以上時,採用多變量變異數分析可減少型一錯誤並同時了解群組間平均數在所有依變項的差異(Bryman & Cramer, 1997)。
24
多重比較(事後比較) 一般在整體性之F檢定達顯著後才進行,比較方式為兩兩比較,但也可因研究目的的不同,只做平均數的多重比較,不必考慮整體性F檢定的結果。 Bonferroni 校正LSD多群比較產生的型一錯誤,校正方法為LSD的p-value×N(N-1)/2若在0.05以下結果顯著。
25
相關分析(皮爾森相關) 相關(correlation)是用以檢驗兩個變項線性關係的統計技術,以相關係數(coefficient of correlation) 來表示其相關程度。 皮爾森相關係數是一個標準化的關聯係數。其原理是先計算出兩個變項的共變量,再除去兩個變項的標準差,加以標準化,得到的一個去除單位的標準化分數。 相關係數介於-1至1之間。
26
迴歸分析(Regression) 基本條件: 連續變項之間的關係
線性關係 (linear relationship) ,指兩個變項的關係可以被一條最具代表性的直線來表達之時,所存在的關連情形。 迴歸分析的結果無法證明 x 和 y 之間有因果關係存在。 因果關係須滿足三個條件:1. 除了評估變數之外,其餘變數保持不變;2. x、y 有顯著相關;3. 因(x)必發生在果(y)之前。 迴歸方程式
27
路徑分析(path analysis) 路徑分析由一系列的迴歸分析所組成,除了借用迴歸方程式的原理,並透過假設性的架構,將不同的方程式加以組合,形成結構化的模式。 優點:可用來證明中介變數的存在與否 缺點:執行n次迴歸,其信心水準1-α會成為0.95n 。 因此,執行愈多次迴歸,其模型之可信度愈低。 A B M Y
28
典型相關分析 多個自變數影響多個因變數 教學內容 整合性動機 工具性動機 教學能力 自我效能 教學環境 期望價值
29
項目分析與信度估計 預試分析 信、效度檢驗 目的在確認量表題目的堪用程度 最重要的工作為項目分析,試探性的信度分析,以作為題目改善的依據
提供各項客觀指標,作為測驗與量表良窳程度的具體證據。
30
二元 羅吉斯迴歸 (Logistic Regression)
適用於兩群體的分類 不需符合一般多變量的嚴格假設及較具強靭性 與區別分析同樣具有正確的統計檢定能力及整合非線性影響的能力 能應用於各種範圍的特徵 適合用於建構決策模型
31
區別分析 (discriminate analysis)
區別分析的主要目的在計算一組「自變項」的線性組合對「間斷變項」加以分類,並檢查再分組的正確率。
32
交叉分析 (列聯表分析 Contingency table)
變數須為名目尺度(不連續變數) 性別:男、女 傳播媒體:電子媒體、平面媒體、網路媒體 只能有兩個變數
33
多重交叉分析(多重列聯表分析) 變數須為名目尺度(不連續變數) 三個變數以上,但仍以三個為主 性別:男、女 地區:如北、中、南
傳播媒體:電子媒體、平面媒體、網路媒體 三個變數以上,但仍以三個為主
34
複選題分析 (Multiple Response)
複選題分析提供多元化的資訊以供決策參考
35
複選題處理程序 資料輸入(以個別題目型態輸入) 定義集群 點選統計分析→複選題分析→定義集合 定義集內的變數 完成虛擬複選題變項
次數分配表分析 交叉表分析
36
複選題實務上的意義
37
同質性檢定 目的 適用時機 檢定不同人口母群,在某一變項的反應是否具有顯著差異;亦即兩個樣本在同一變項中之分佈情形。
郵寄問卷時,比較早期回收群及後期跟催回收群之人口統計變項。 街頭訪問時,比較願意主動作答群及被動作答群之人口統計變項。 受訪者中包含不同團體。 網路問卷與紙本問卷的比較。
38
適合度檢定 目的 適用時機 研究樣本是否抽樣母群分配相符合時,以卡方檢定進行之;每次檢定內容僅涉及一個變項。
當研究者想知道樣本是否能代表母體時,用人口統計變項與母體資料比較。(如內政部有完整的人口統計資料)。
39
獨立性檢定 目的 想要同時檢定兩個類別變項之間的關係是否相關時,採用卡方檢定。 適用時機 如研究者想知道學歷與性別之間是否有相關即可採用之。
40
離散與連續變數的互換 連續轉不連續 不連續轉連續 採人為操弄,將連續變數分類。 例:將全班成績改為高分組、中分組、低分組
虛擬變數(Dummy Variables)=水準數(n) -1 例:地區:東部、北部、中部、南部等四個水準 DV可設為(0,0,0) 、 (1,0,0) 、 (0,1,0) 、 (0,0,1) 數量最多的設為(0,0,0) 。
42
三星統計服務有限公司 http://www.semsoeasy.com.tw/
42
43
三星統計服務有限公司 SEM教育訓練 演講邀約 論文分析統計諮詢 SPSS 統計訓練 SEM 基礎訓練 資料分析 統計小班教學
IBM SPSS暨Amos 銷售 Fax:
44
三星統計服務有限公司 全國最專業的SEM統計服務團隊 快速並正確解決您統計上的問題 教育訓練沒有煩人的數學推導、只有實例的深入探討
以生活上的例子解釋抽象的統計概念 全亞洲唯一的白話文結構方程模型教學 全台唯一充滿熱情、活力、幽默的統計學講師
Similar presentations