Download presentation
Presentation is loading. Please wait.
1
第十三章 調查研究
2
Key words 李克特量尺 信度 效度 因素分析
3
調查(survey)分為普查及抽樣調查:
前者通常是政府機構為掌握國家人民各項情況或產 業結構,以作為未來施政方向依據,亦可用來作國 與國之間的比較,以了解本國在國際間之表現。 抽樣調查係對全國部份所作的調查,政府機構、私 人機構、學術機構因實際目的而執行,此類調查涉 及抽樣問題,需小心且依照抽樣方法流程方能得到 代表母群體之樣本。研究人員必須依不同的目地、 領域及成本,選擇適當之抽樣方法(可參閱抽樣調 查之相關書籍)或研究設計方法(本書第十四章內 容)。
4
調查中,最常被使用的工具是使用問卷,我們可以 將想了解的問題設計在問卷中,讓受測者填答,而 獲得答案。問卷調查一般大家都不陌生,姑且不論 問卷設計的品質或抽樣方法是否合理,填答過問卷 的人不在少數,例如:巿場調查(想了解某項產品 的接受度、行銷的效果、作為新產品研發的參考… 等)、和醫療及照護有相關(跌倒發生之原因、不 同手術方式疼痛調查、癌症治療生活品質調查…等 等)、民意調查(選舉前之支持度率、政黨傾向、 施政滿意度…等等)。這些都是為了特定目的及對 象所設計出來的問卷調查。
5
問卷設計前需要了解調查研究的目的為何,才能決 定受測對象,進一步針對主題設計所需要的題目, 問卷的難易度和研究主題有很大關係,也決定了調 查方法的施行。
醫學領域中,涉及行為相關的研究如:生活品質、 行為態度、人格特質…等等研究,最常使用問卷調 查。 依過去的經驗顯示,量測的內容是否有效?是否可 以正確測得研究主題的答案?經常會涉及問卷內容 的設計,本章將介紹一些分析方法來評估調查所設 計的問卷是否有效。
6
以下是一件有關台灣醫院照護品質測量工具1研究的部分報告:
“….為發展一份適用於台灣、以病患經驗為主軸且具有信、效度之醫院 醫療照護品質(本研究中簡稱為醫院品質)測量工具。便利取樣全台灣 20間自願參與研究之醫院,選取出院急性病人2,676名為樣本,進行問 卷調查,有效回收問卷數為2,005份(回收率75%)。以心理計量項目 分析程序選取核心題目,並檢驗核心問卷之信、效度。.... 醫院品質核 心問卷計有27題,包含六大向度:醫師照護、護理照護、整體醫病互 動、社會心理支持、尊重與醫院環境。信度方面:上述六個向度之 Cronbach’s α值為0.72至0.89、折半信度值為0.64至0.86,顯示內 部一致性良好。效度方面:題目與所屬向度總分之皮爾森相關係數值介 於0.57至0.88(p值<0.01),量表內容效度良好。…. 結論:本量表 具有良好之信、效度,…國內目前已具有全面之醫療照護品質指標。”
7
13.1設計問卷內容時注意事項 問卷設計應和研究主題相關;可先考慮數個面向,再 仔細思考各面向內需要包含哪些問題,這樣較能確切 掌握問卷內容是否和研究主題相關。 問卷設計時應考量題數多寡及是否容易理解內容,免 得使受測者失去耐心,使得答題正確性及客觀性降低。 問題中的選項設計不宜太多,可考慮將普遍性的選項 列出後,再加一項 “其他"以包含不具普遍性的項目。 選項應明確清楚,避免選項彼此重疊或未包含在項目 內的情形。 設計問卷題目時應有整體性的規劃,考慮是否合乎邏 輯的正確性。設計結構鬆散或內容太隨性,會令人有 不專業、不正式的感覺,不易使受測者信任。
8
答題選項為程度的差異時,需含正、反面且相同程度 之選項。如:李克特選項(Likert item):滿意程度 ──非常不滿意、不滿意、無意見、滿意、非常滿意。 此滿意程度為5點量尺,1-5分,每單獨問題對應一 個數值,也有方向性。最常使用李克特量選項為5點 量尺,1分到5分是由最不滿意到最滿意,為單一方向 性,也可相反方向,由最滿意至最不滿意。 除非研究主題想得到受測者之確切想法及內容,否則 設計問題時,多考慮封閉性的選項,數據整理方便且 好分析資料。
9
此外,問卷設計時,應同時考慮調查方法,以決定 問卷之長短及答題之困難度。成本和問卷回覆之品 質呈正比,面訪的成本較高,但遺失值較少且回覆 率較高,品質較佳。以下是郵寄方式調查和面訪比 較的結果:
自填(郵寄 ) 自填(面對面) 電訪 面訪 成本 ++ + - 時間 標準化 +/- 深入程度 回覆率 遺失值 優點+; 缺點-; 中等+/-
10
13.2 李克特量尺(Likert scale) 李克特量尺最早是由Rensis Likert於1932年提出,主 要是由測量"態度"而發展出來的,希望將無形心理層 面的觀感,利用量化工具予以估評,目前也常當成心理 測量之尺度,通常假設此量尺具有"單一方向性"且" 每項目間之差異是等距"。 若 “沒有"點到點等距的假設下,資料在統計上屬於順 序尺度(ordinal scale)的資料,1-2選項間的距離和 2-3選項間的距離並不相等,雖然都只差1分,不表示實 際程度上的差距是相同的,在統計數據呈現上多以中位 數代表集中趨勢,次數分配、無母數方法常被使用。
11
在李克特選項的使用上,假設 “點到點之間是等距” 的話,在實際程度上被假設為相等,此資料即為區 間尺度,分數間等距差即代表實際程度的等距差。 資料呈現上需使用平均數或標準差代表集中趨勢及 分散程度才合理,進而可使用廻歸分析或其他具常 態假設之母數統計方法。 除5點量尺外,在心理學上也常用7點、9點量尺或 其他,將多個題目組成一個面向,多個面向構成一 份問卷,總分(可能為100分) 為李克特量尺 (Likert scale),代表這問卷主題所要了解之感 受程度。
12
13.3 問卷之信效度 問卷調查雖然是個容易使用的調查工具,但使用者需了 解如何評估問卷的品質,有兩個重要指標:信度及效度, 代表問卷設計品質及信賴程度。 前測 (Pilot testing):在問卷設計後,尚未大量印刷 施測前,找一群受測者接受測驗即為前測。前測的目地 在於想知道問卷的題目內容是否清晰明確及客觀、對於 受測者在閱讀上是否合宜、架構設計上是否清楚…等, 趁著前測發現問題,並修改或調整問卷內容。前測之樣 本數不需太大,重要的是受測者可否提供有意義之回饋, 讓研究者了解問卷問題所在,因而對於受測者(需是未 來預備受測的對象)的選擇十分重要。
13
我們使用R-web中的一個範例資料,做為信度分析 的例子:某巿針對中學進行調查想了解導師之班級 經營成效,對於巿內的20所國中進行隨機抽樣,在 正式調查前先進行前測,預計回收200份問卷,問 卷中包含性別、地區、學生年級(一~三年級)、學校 班級數(30班以下、以上),以及20題有關於班級經 營之問題,每題之選項答案分別為很差、差、沒意 見、好、很好,並量化成1-5分。 信度(reliability) 信度是指問卷測量分數具有一致性、穩定性、可靠 性,以提供信賴程度的評量值。信度越高的問卷表 示受測者答案的可信度越高。信度可分為內在信度 及外在信度。
14
內在(inter-rater)信度 內在信度主要為問卷項目之內部一致性、穩定性的 程度,常用的評估方法如下:
(a) Cronbach’s α及標準化Cronbach’s α K表示問卷題數, s 𝑖 2 為所有受測者針對第i個問題回答值 (xi)的變異數, s 𝐻 2 為所有受測者將所有問題的回答值加 總後(H=x1+x2…+ xK)之變異數。由式子中可了解, 若每問題變異數的加總( 𝑖=1 𝐾 s 𝑖 2 )和 s 𝐻 2 愈接近,則 Cronbach’s α值愈高,表示內容一致性程度愈高。
15
標準化Cronbach’s α為 𝑟 為每問項答案值間相關係數之平均,相關性愈高標 準化Cronbach’s α也愈高。一份問卷中,每個題目 分數都相同的話(如:皆為李克特選項,1-5分), 則是否有標準化Cronbach’s α值皆差異不大;但若 問卷題目中,不是每題之分數皆相同時,則需使用標 準化之Cronbach’s α。
16
(b) 折半信度(Split-half reliability),將問卷內容分為 兩等份(依奇數題、偶數題或隨機選取),兩份內容得 分之相關性高低來判斷,利用皮爾森相關係數、史皮爾 曼相關係數評估(請見第八章)或斯皮爾曼-布朗公式 (Spearman-Brown formula)校正,可得折半信度 α ∗ , 𝑘 ∗ 問卷縮短的倍數,在此將問卷分為兩等份,取 𝑘 ∗ =2; 𝑟 為此兩等份問項總分之相關係數,代表半份問卷之信度, 校正為全份問卷之信度。信度大於0.7時表示問卷內部的 一致性良好或問卷分數具穩定性。
17
(c) 當題目選項只有二元變項(是、否或對、錯)時,經 常使用庫李信度 (Kuder-Richardson, 1937) 替代 Cronbach’s α。 每題中兩類之百分比分別為p、q, 總題數為K,庫李信度定義為 R-web 以點選方式選用路徑:"分析方法多變量分析信、效 度分析信度步驟一:資料匯入:範例資料檔(分析方 法),選取”範例F-9” 步驟二:參數設定:選擇要進行 分析的變數(或稱項目),將q1-q20選入分析進階選項: 勾選Cronbach's α及折半信度開始分析"。
18
以下為Cronbach's α、標準化Cronbach's α、折半信度 之結果:Cronbach's α為0
以下為Cronbach's α、標準化Cronbach's α、折半信度 之結果:Cronbach's α為0.9273,而標準化的 Cronbach's α為0.9292,由於這20題之分數皆落在1-5 分,屬相同之尺度,因此是否標準化影響不大。 目個數 Number of items α值 α值標準差 Std. err. for α α值95%信賴區間 95% C.I. for α 標準化α值 standardized α 標準化α值標準差 Std. err. for standardized α 標準化α值95%信賴區間 95% C.I. for standardized α 下界 lower 上界 upper 20 0.9273 0.0053 0.917 0.9376 0.9292 0.0051 0.9192 0.9392
19
計算校正後之折半信度時,選擇將問卷分為兩等份, 因此在判讀時選擇”等長的係數”為主。此兩等份問 項之相關係數為 𝑟 =0
計算校正後之折半信度時,選擇將問卷分為兩等份, 因此在判讀時選擇”等長的係數”為主。此兩等份問 項之相關係數為 𝑟 =0.8006,即是折半信度。若是 利用斯皮爾曼-布朗公式(Spearman-Brown formula)校正,可得折半信度 α ∗ =0.8892。以上 數個信度皆在0.8以上,表示問卷內部一致性良好。 折半信度係數(Correlation between halves) 0.8006 等長的Spearman-Brown係數 0.8892
20
外在(intra)信度 以上計算信度常用的統計方法為kappa係數,用來 比較兩次受測結果分數的一致性程度:
比較不同時間相同(或不同)的受測對象、不同時間相 同(或不同)施測者,所測量結果分數之一致性。針對 同一群人不同時間點的測量,外在信度又稱為再測信度 或重測信度(test retest reliability);針對不同施測 者對同一群人之重覆測量,外在信度又稱為為施測者間 信度或複本信度(inter-rater reliability)。 以上計算信度常用的統計方法為kappa係數,用來 比較兩次受測結果分數的一致性程度: kappa係數值落於-1~1之間,大於0.6以上時,表示兩次 測量結果具有中度一致性,若能大於0.8表一致性程度高。
21
𝑃 0 為每個項目之觀察前後測量結果一致性百分比的 和, 𝑃 𝑐 為前後測量結果預期相同之機率。
若資料一致性程度愈高,則 𝑃 0 愈接近1,kappa值 愈接近1,代表一致性程度愈好。 kappa係數通常使用在類別尺度及順序尺度的資料。 下面是第一次及第二次測量是否滿意的資料表,二 次滿意度測量結果的一致性程度為何? 第一次測量 第二次測量 滿意 不滿意 11 a 2 c 23 R1 4 b 20 d 15 R2 15 C1 22 C2 38 n
22
可得Kappa係數值0.66表示二次滿意度測量的結果 具有中度一致性。
這是2 x 2的列聯表形式,若問卷選項是李克特5點 量尺,前後測量之結果會產生5 x 5的列聯表,亦 可使用Kappa係數,但期望值 𝑃 𝑐 的計算方式較為複 雜(可利用軟體計算),但概念是相同的,都是表 達前後測量結果一致性之指標。 Kappa係數除了可以計算外在信度外,也可以使用 來計算內在信度。R-web提供: 針對同一次測量不同項目間之Kappa係數(前提是這些項目 測量之目的原則上要相同) 針對同一次測量項目不同資料間之Kappa係數(需切割原資 料或輸入新資料)(類似於折半信度的概念)
23
Cohen's Kappa係數 Cohen's Kappa coefficient
R-web 以點選方式選用路徑:"分析方法多變量分析信、效度 分析信度步驟一:資料匯入:範例資料檔(分析方法), 選取”範例F-9” 步驟二:參數設定:選擇要進行分析的變 數(或稱項目),將q1-q20選入分析,並勾選計算Kappa係 數I(資料等級需為類別型態)及計算同一項目的Kappa係數 (切割原資料) 進階選項選擇欲計算Kappa係數的項目 選入項目:q1開始分析"。 分析q1項目,將資料切割成兩組後之Kappa係數為0.0113,即 代表q1項目資料間之一致性之程度;檢定結果顯示前後組資料結 果不具一致性。 單一項目的Kappa係數 項目組合 items Cohen's Kappa係數 Cohen's Kappa coefficient Z統計量 Z statistic P-值 p-value q1 - q1 0.0113 0.221 0.8251
24
效度(validity) 我們用效度指標來衡量問卷測量的結果是否可以反應研 究主題之特質。常見評估方法為:
內容效度(content validity):衡量問卷內容是否可 反應主題,即研究主題之念和所對應之問卷項目內容是 否有一致性,問卷內容是否含蓋研究主題所要討論面向。 一般經由專家設計或評估後之問卷,即具有內容效度。 校標關聯效度(criterion-related validity)或校標效 度:評估問卷測量可預測多少研究主題之特質,此特質 應和其他問卷工具或行為(為黃金準則)有高度關聯。 例如:模擬考分數能和學測考試分數(黃金準則)具有 高度相關聯性時,則針學測而言,模擬考測量具有高度 之校標效度,或高預測效度。
25
建構效度(construct validity):衡量研究者是否已測 到想要的構面或特質。此構面應有具體之特質、共同了 解之概念、或由某人所建構出之概念,例如:數學程度。 可利用因素分析(factor analysis)進行評估,以下兩個 方法,經常用於判斷是否適合進行因素分析: KMO (Kaiser-Meyer-Olkin)值判斷是否可以作因素 分析?其值介於0~1之間,愈大表示愈適合作因素分 析,表示變項間的共同因素愈多。KMO大於0.7表示 中等程度,適合作因素分析。 Bartlett’s球形檢定,為檢定母體間之相關性是否存在, 若具相關性則適合作因素分析。在虛無假設下,檢定 統計量會近似於卡方分配,若項目間之相關係數愈高, 此檢定統計量會愈大,p值愈小。
26
R-web 由範例F-9來檢視此問卷是否適合作因素分析。以點選方式選 用路徑:"分析方法多變量分析信、效度分析信度步 驟一:資料匯入:範例資料檔(分析方法),選取”範例F-9” 步驟二:參數設定:選擇要進行分析的變數(或稱項目),將 q1-q20選入分析進階選項:效度分析勾選Bartlett球形 檢定及KMO指標。 以下結果:KMO指標為0.9428,其值接近1,表示適合作 因素分析。Bartlett球形檢定之結果,p值小於0.0001,顯 示適合進行因素分析。 KMO(Kaiser's MSA)I抽樣適切性指標 KMO值II 0.9428 Bartlett球形檢定(Bartlett's sphericity test) 檢定統計量 3766.8 自由度 190 顯著性 < 1e-04
27
在問卷的使用上,應注意受測者之族群是否為原本 問卷發展之對象。若問卷為國外發展之問卷,不能 自行翻而直接使用,因為和問卷設計時之研究對象 已有不同。
國外問卷經過翻譯後,需經專家討論後,確定翻譯 之語意和問卷原本之內涵無差異,及適合一般受測 者閱讀之程度,再進行前測(pilot study),並測量 問卷之信度及效度,才能供國人使用。
28
作業 利用R-web範例資料庫(範例F-9)的前100人資料為樣本,回答下列問題:
計算每變項之描述性統計(例如:平均數、變異數、百分比….)。 計算Cronbach's α及標準化Cronbach's α值,並解釋兩者意義。 利用Kappa方法,檢定第一題(q1)和第二題(q2)間的信度,應如何解讀?並計算此兩題間的皮爾森相關係數,並和Kappa的結果比較。 利用KMO判斷,此筆資料是否適合進行因素分析。 題目間的相關係數愈小,則信度會如何改變?
29
The End
Similar presentations