第十三章調查研究.

第十三章調查研究

Key words 李克特量尺信度效度因素分析

調查（survey）分為普查及抽樣調查：
前者通常是政府機構為掌握國家人民各項情況或產業結構，以作為未來施政方向依據，亦可用來作國與國之間的比較，以了解本國在國際間之表現。抽樣調查係對全國部份所作的調查，政府機構、私人機構、學術機構因實際目的而執行，此類調查涉及抽樣問題，需小心且依照抽樣方法流程方能得到代表母群體之樣本。研究人員必須依不同的目地、領域及成本，選擇適當之抽樣方法（可參閱抽樣調查之相關書籍）或研究設計方法（本書第十四章內容）。

調查中，最常被使用的工具是使用問卷，我們可以將想了解的問題設計在問卷中，讓受測者填答，而獲得答案。問卷調查一般大家都不陌生，姑且不論問卷設計的品質或抽樣方法是否合理，填答過問卷的人不在少數，例如：巿場調查（想了解某項產品的接受度、行銷的效果、作為新產品研發的參考… 等）、和醫療及照護有相關（跌倒發生之原因、不同手術方式疼痛調查、癌症治療生活品質調查…等等）、民意調查（選舉前之支持度率、政黨傾向、施政滿意度…等等）。這些都是為了特定目的及對象所設計出來的問卷調查。

問卷設計前需要了解調查研究的目的為何，才能決定受測對象，進一步針對主題設計所需要的題目，問卷的難易度和研究主題有很大關係，也決定了調查方法的施行。
醫學領域中，涉及行為相關的研究如：生活品質、行為態度、人格特質…等等研究，最常使用問卷調查。依過去的經驗顯示，量測的內容是否有效？是否可以正確測得研究主題的答案？經常會涉及問卷內容的設計，本章將介紹一些分析方法來評估調查所設計的問卷是否有效。

以下是一件有關台灣醫院照護品質測量工具1研究的部分報告:
“….為發展一份適用於台灣、以病患經驗為主軸且具有信、效度之醫院醫療照護品質（本研究中簡稱為醫院品質）測量工具。便利取樣全台灣 20間自願參與研究之醫院，選取出院急性病人2,676名為樣本，進行問卷調查，有效回收問卷數為2,005份（回收率75%）。以心理計量項目分析程序選取核心題目，並檢驗核心問卷之信、效度。.... 醫院品質核心問卷計有27題，包含六大向度：醫師照護、護理照護、整體醫病互動、社會心理支持、尊重與醫院環境。信度方面：上述六個向度之 Cronbach’s α值為0.72至0.89、折半信度值為0.64至0.86，顯示內部一致性良好。效度方面：題目與所屬向度總分之皮爾森相關係數值介於0.57至0.88（p值＜0.01），量表內容效度良好。…. 結論：本量表具有良好之信、效度，…國內目前已具有全面之醫療照護品質指標。”

13.1設計問卷內容時注意事項問卷設計應和研究主題相關；可先考慮數個面向，再仔細思考各面向內需要包含哪些問題，這樣較能確切掌握問卷內容是否和研究主題相關。問卷設計時應考量題數多寡及是否容易理解內容，免得使受測者失去耐心，使得答題正確性及客觀性降低。問題中的選項設計不宜太多，可考慮將普遍性的選項列出後，再加一項 “其他＂以包含不具普遍性的項目。選項應明確清楚，避免選項彼此重疊或未包含在項目內的情形。設計問卷題目時應有整體性的規劃，考慮是否合乎邏輯的正確性。設計結構鬆散或內容太隨性，會令人有不專業、不正式的感覺，不易使受測者信任。

答題選項為程度的差異時，需含正、反面且相同程度之選項。如：李克特選項（Likert item）：滿意程度 ──非常不滿意、不滿意、無意見、滿意、非常滿意。此滿意程度為5點量尺，1-5分，每單獨問題對應一個數值，也有方向性。最常使用李克特量選項為5點量尺，1分到5分是由最不滿意到最滿意，為單一方向性，也可相反方向，由最滿意至最不滿意。除非研究主題想得到受測者之確切想法及內容，否則設計問題時，多考慮封閉性的選項，數據整理方便且好分析資料。

此外，問卷設計時，應同時考慮調查方法，以決定問卷之長短及答題之困難度。成本和問卷回覆之品質呈正比，面訪的成本較高，但遺失值較少且回覆率較高，品質較佳。以下是郵寄方式調查和面訪比較的結果：
自填（郵寄）自填（面對面）電訪面訪成本 ++ + －時間標準化 +/－深入程度回覆率遺失值優點+；缺點－；中等+/－

13.2 李克特量尺（Likert scale）李克特量尺最早是由Rensis Likert於1932年提出，主要是由測量＂態度＂而發展出來的，希望將無形心理層面的觀感，利用量化工具予以估評，目前也常當成心理測量之尺度，通常假設此量尺具有＂單一方向性＂且＂每項目間之差異是等距＂。若 “沒有＂點到點等距的假設下，資料在統計上屬於順序尺度（ordinal scale）的資料，1-2選項間的距離和 2-3選項間的距離並不相等，雖然都只差1分，不表示實際程度上的差距是相同的，在統計數據呈現上多以中位數代表集中趨勢，次數分配、無母數方法常被使用。

在李克特選項的使用上，假設 “點到點之間是等距” 的話，在實際程度上被假設為相等，此資料即為區間尺度，分數間等距差即代表實際程度的等距差。資料呈現上需使用平均數或標準差代表集中趨勢及分散程度才合理，進而可使用廻歸分析或其他具常態假設之母數統計方法。除5點量尺外，在心理學上也常用7點、9點量尺或其他，將多個題目組成一個面向，多個面向構成一份問卷，總分(可能為100分) 為李克特量尺（Likert scale），代表這問卷主題所要了解之感受程度。

13.3 問卷之信效度問卷調查雖然是個容易使用的調查工具，但使用者需了解如何評估問卷的品質，有兩個重要指標：信度及效度，代表問卷設計品質及信賴程度。前測（Pilot testing）：在問卷設計後，尚未大量印刷施測前，找一群受測者接受測驗即為前測。前測的目地在於想知道問卷的題目內容是否清晰明確及客觀、對於受測者在閱讀上是否合宜、架構設計上是否清楚…等，趁著前測發現問題，並修改或調整問卷內容。前測之樣本數不需太大，重要的是受測者可否提供有意義之回饋，讓研究者了解問卷問題所在，因而對於受測者（需是未來預備受測的對象）的選擇十分重要。

我們使用R-web中的一個範例資料，做為信度分析的例子：某巿針對中學進行調查想了解導師之班級經營成效，對於巿內的20所國中進行隨機抽樣，在正式調查前先進行前測，預計回收200份問卷，問卷中包含性別、地區、學生年級(一～三年級)、學校班級數(30班以下、以上)，以及20題有關於班級經營之問題，每題之選項答案分別為很差、差、沒意見、好、很好，並量化成1-5分。信度（reliability）信度是指問卷測量分數具有一致性、穩定性、可靠性，以提供信賴程度的評量值。信度越高的問卷表示受測者答案的可信度越高。信度可分為內在信度及外在信度。

內在（inter-rater）信度內在信度主要為問卷項目之內部一致性、穩定性的程度，常用的評估方法如下：
(a) Cronbach’s α及標準化Cronbach’s α K表示問卷題數， s 𝑖 2 為所有受測者針對第i個問題回答值（xi）的變異數， s 𝐻 2 為所有受測者將所有問題的回答值加總後（H=x1+x2…+ xＫ）之變異數。由式子中可了解，若每問題變異數的加總（ 𝑖=1 𝐾 s 𝑖 2 ）和 s 𝐻 2 愈接近，則 Cronbach’s α值愈高，表示內容一致性程度愈高。

標準化Cronbach’s α為 𝑟 為每問項答案值間相關係數之平均，相關性愈高標準化Cronbach’s α也愈高。一份問卷中，每個題目分數都相同的話（如：皆為李克特選項，1-5分），則是否有標準化Cronbach’s α值皆差異不大；但若問卷題目中，不是每題之分數皆相同時，則需使用標準化之Cronbach’s α。

(b) 折半信度（Split-half reliability），將問卷內容分為兩等份（依奇數題、偶數題或隨機選取），兩份內容得分之相關性高低來判斷，利用皮爾森相關係數、史皮爾曼相關係數評估（請見第八章）或斯皮爾曼-布朗公式（Spearman-Brown formula）校正，可得折半信度 α ∗ ， 𝑘 ∗ 問卷縮短的倍數，在此將問卷分為兩等份，取 𝑘 ∗ =2； 𝑟 為此兩等份問項總分之相關係數，代表半份問卷之信度，校正為全份問卷之信度。信度大於0.7時表示問卷內部的一致性良好或問卷分數具穩定性。

(c) 當題目選項只有二元變項(是、否或對、錯)時，經常使用庫李信度 (Kuder-Richardson, 1937) 替代 Cronbach’s α。每題中兩類之百分比分別為p、q，總題數為K，庫李信度定義為 R-web 以點選方式選用路徑：＂分析方法多變量分析信、效度分析信度步驟一：資料匯入：範例資料檔(分析方法)，選取”範例F-9” 步驟二：參數設定：選擇要進行分析的變數(或稱項目)，將q1-q20選入分析進階選項：勾選Cronbach's α及折半信度開始分析＂。

以下為Cronbach's α、標準化Cronbach's α、折半信度之結果：Cronbach's α為0
以下為Cronbach's α、標準化Cronbach's α、折半信度之結果：Cronbach's α為0.9273，而標準化的 Cronbach's α為0.9292，由於這20題之分數皆落在1-5 分，屬相同之尺度，因此是否標準化影響不大。目個數 Number of items α值 α值標準差 Std. err. for α α值95%信賴區間 95% C.I. for α 標準化α值 standardized α 標準化α值標準差 Std. err. for standardized α 標準化α值95%信賴區間 95% C.I. for standardized α 下界 lower 上界 upper 20 0.9273 0.0053 0.917 0.9376 0.9292 0.0051 0.9192 0.9392

計算校正後之折半信度時，選擇將問卷分為兩等份，因此在判讀時選擇”等長的係數”為主。此兩等份問項之相關係數為 𝑟 ＝0
計算校正後之折半信度時，選擇將問卷分為兩等份，因此在判讀時選擇”等長的係數”為主。此兩等份問項之相關係數為 𝑟 ＝0.8006，即是折半信度。若是利用斯皮爾曼-布朗公式（Spearman-Brown formula）校正，可得折半信度 α ∗ ＝0.8892。以上數個信度皆在0.8以上，表示問卷內部一致性良好。折半信度係數(Correlation between halves) 0.8006 等長的Spearman-Brown係數 0.8892

外在（intra）信度以上計算信度常用的統計方法為kappa係數，用來比較兩次受測結果分數的一致性程度:
比較不同時間相同（或不同）的受測對象、不同時間相同（或不同）施測者，所測量結果分數之一致性。針對同一群人不同時間點的測量，外在信度又稱為再測信度或重測信度（test retest reliability）；針對不同施測者對同一群人之重覆測量，外在信度又稱為為施測者間信度或複本信度（inter-rater reliability）。以上計算信度常用的統計方法為kappa係數，用來比較兩次受測結果分數的一致性程度: kappa係數值落於-1~1之間，大於0.6以上時，表示兩次測量結果具有中度一致性，若能大於0.8表一致性程度高。

𝑃 0 為每個項目之觀察前後測量結果一致性百分比的和， 𝑃 𝑐 為前後測量結果預期相同之機率。
若資料一致性程度愈高，則 𝑃 0 愈接近1，kappa值愈接近1，代表一致性程度愈好。 kappa係數通常使用在類別尺度及順序尺度的資料。下面是第一次及第二次測量是否滿意的資料表，二次滿意度測量結果的一致性程度為何？第一次測量第二次測量滿意不滿意 11 a 2 c 23 R1 4 b 20 d 15 R2 15 C1 22 C2 38 n

可得Kappa係數值0.66表示二次滿意度測量的結果具有中度一致性。
這是2 x 2的列聯表形式，若問卷選項是李克特5點量尺，前後測量之結果會產生5 x 5的列聯表，亦可使用Kappa係數，但期望值 𝑃 𝑐 的計算方式較為複雜（可利用軟體計算），但概念是相同的，都是表達前後測量結果一致性之指標。 Kappa係數除了可以計算外在信度外，也可以使用來計算內在信度。R-web提供：針對同一次測量不同項目間之Kappa係數(前提是這些項目測量之目的原則上要相同) 針對同一次測量項目不同資料間之Kappa係數(需切割原資料或輸入新資料)(類似於折半信度的概念)

Cohen's Kappa係數 Cohen's Kappa coefficient
R-web 以點選方式選用路徑：＂分析方法多變量分析信、效度分析信度步驟一：資料匯入：範例資料檔(分析方法)，選取”範例F-9” 步驟二：參數設定：選擇要進行分析的變數(或稱項目)，將q1-q20選入分析，並勾選計算Kappa係數I(資料等級需為類別型態)及計算同一項目的Kappa係數 (切割原資料) 進階選項選擇欲計算Kappa係數的項目 選入項目：q1開始分析＂。分析q1項目，將資料切割成兩組後之Kappa係數為0.0113，即代表q1項目資料間之一致性之程度；檢定結果顯示前後組資料結果不具一致性。單一項目的Kappa係數項目組合 items Cohen's Kappa係數 Cohen's Kappa coefficient Z統計量 Z statistic P-值 p-value q1 - q1 0.0113 0.221 0.8251

效度（validity）我們用效度指標來衡量問卷測量的結果是否可以反應研究主題之特質。常見評估方法為：
內容效度（content validity）：衡量問卷內容是否可反應主題，即研究主題之念和所對應之問卷項目內容是否有一致性，問卷內容是否含蓋研究主題所要討論面向。一般經由專家設計或評估後之問卷，即具有內容效度。校標關聯效度（criterion-related validity）或校標效度：評估問卷測量可預測多少研究主題之特質，此特質應和其他問卷工具或行為（為黃金準則）有高度關聯。例如：模擬考分數能和學測考試分數（黃金準則）具有高度相關聯性時，則針學測而言，模擬考測量具有高度之校標效度，或高預測效度。

建構效度（construct validity）：衡量研究者是否已測到想要的構面或特質。此構面應有具體之特質、共同了解之概念、或由某人所建構出之概念，例如：數學程度。可利用因素分析（factor analysis）進行評估，以下兩個方法，經常用於判斷是否適合進行因素分析： KMO (Kaiser-Meyer-Olkin)值判斷是否可以作因素分析？其值介於0~1之間，愈大表示愈適合作因素分析，表示變項間的共同因素愈多。KMO大於0.7表示中等程度，適合作因素分析。 Bartlett’s球形檢定，為檢定母體間之相關性是否存在，若具相關性則適合作因素分析。在虛無假設下，檢定統計量會近似於卡方分配，若項目間之相關係數愈高，此檢定統計量會愈大，p值愈小。

R-web 由範例F-9來檢視此問卷是否適合作因素分析。以點選方式選用路徑：＂分析方法多變量分析信、效度分析信度步驟一：資料匯入：範例資料檔(分析方法)，選取”範例F-9”  步驟二：參數設定：選擇要進行分析的變數(或稱項目)，將 q1-q20選入分析進階選項：效度分析勾選Bartlett球形檢定及KMO指標。以下結果：KMO指標為0.9428，其值接近1，表示適合作因素分析。Bartlett球形檢定之結果，p值小於0.0001，顯示適合進行因素分析。 KMO(Kaiser's MSA)I抽樣適切性指標 KMO值II 0.9428 Bartlett球形檢定(Bartlett's sphericity test) 檢定統計量 3766.8 自由度 190 顯著性 < 1e-04

在問卷的使用上，應注意受測者之族群是否為原本問卷發展之對象。若問卷為國外發展之問卷，不能自行翻而直接使用，因為和問卷設計時之研究對象已有不同。
國外問卷經過翻譯後，需經專家討論後，確定翻譯之語意和問卷原本之內涵無差異，及適合一般受測者閱讀之程度，再進行前測(pilot study)，並測量問卷之信度及效度，才能供國人使用。

作業利用R-web範例資料庫(範例F-9)的前100人資料為樣本，回答下列問題：
計算每變項之描述性統計(例如：平均數、變異數、百分比….)。計算Cronbach's α及標準化Cronbach's α值，並解釋兩者意義。利用Kappa方法，檢定第一題(q1)和第二題(q2)間的信度，應如何解讀？並計算此兩題間的皮爾森相關係數，並和Kappa的結果比較。利用KMO判斷，此筆資料是否適合進行因素分析。題目間的相關係數愈小，則信度會如何改變？

The End

第十三章調查研究.

Similar presentations

Presentation on theme: "第十三章調查研究."— Presentation transcript:

Similar presentations

About project

反馈

请登录

Auth with social network:

第十三章 調查研究.

Similar presentations

Presentation on theme: "第十三章 調查研究."— Presentation transcript:

Similar presentations

About project

反馈

第十三章調查研究.

Presentation on theme: "第十三章調查研究."— Presentation transcript: