信度效度分析
信度 一、信度的意義 所謂信度是衡量沒有誤差的程度,也是測驗結果的一致性(consistency)程度,信度是以衡量的變異理論為基礎。
二、衡量誤差的意義與來源 衡量誤差可分為系統性誤差及隨機性誤差。一般而言,大部份的誤差是系統性的(從偏差而來)。所謂系統性誤差也被視成常數性(constant)誤差。而隨機性誤差(random error)則不是一種常數性誤差,其原因可能來自情境因素,或者被受測者一時的情緒而影響。衡量誤差可能的來源如下: 1.由回應者(respondent)產生的誤差 2.由情境因素產生的誤差 3.由衡量者產生的誤差 4.由衡量工具產生的誤差
三、以數學的觀點來解釋誤差 四、衡量信度的方法 1.再測信度(test-retest method):再測信 度是讓同一組受測者,在前後兩個時 間內測驗兩次,以其兩次測驗的結果 求其相關係數,而此係數稱為再測信 度 (test-retest reliability)。
2.折半信度(split-half method):折半信 度是將受測題目分成兩半,然後再以 前半段之題目與後半段之題目做相 關,若相關程度很高就代表折半信度 很高,是考驗衡量的同質性。
3.複本信度(equivalent-forms method):為了 讓不同程度的受測者能夠明確瞭解問卷題 目的意思,有時候同一個測驗中有甲、乙 卷兩種以上的複本,由一組受試者先用甲 卷進行測試,同組人或另外一個人再用乙 卷進行測試,用這兩種測驗的結果求其相 關係數即為複本信度。
4.庫李信度(Kuder-Richardson reliability) 目的在於分析問項間的一致性。在估計信度上,最常用的是庫李二十號公式: 其中 K:表示整份測驗的題數 :表整個測驗中每題答對與答錯百分比乘 積之總合 S2:表示測驗總分的變異量
L. J. Cronbach另創係數,其公式如下: 其中, :為估計的信度 :測驗的總題數 :測驗的總變異數 :題目與另一題目之共變數
利用上述之公式,我們可以求得因素一之α值為: 共變數矩陣(因素一) Sc6 Sc7 Sc8 Sc9 1.047 0.992 1.630 0.667 1.052 1.247 0.643 0.988 0.961 1.218 利用上述之公式,我們可以求得因素一之α值為:
效度 一、效度的意義 所謂效度是指衡量的工具是否能真正衡量到研究者想要衡量的問題。
二、效度的種類 1.內容效度(content validity): 以研究者的專業知識來主觀判斷所選擇的尺度是否能正確的衡量研究所欲衡量的東西。 2.效標關聯效度(criterion-related validity): 所謂效標關聯效度是指使用中的衡量工具和其他的衡量工具來比較兩者是否具有關聯性。
3.建構效度(construct validity):如果研究者要瞭解某種衡量工具真正要衡量的是什麼,那即是關心它的建構效度。 4.學說效度(nomological validity):學說效度有時被稱為“通則化的效度(lawlike validity)”,學說效度是基於對構念和從理論建構的正式假設而來的衡量項目的明確調查。
信度和效度及其影響因素 之關係 一、信度和效度的關係 情況一,彈痕分散於靶內各處,並無一致性可言,以衡量 的術語來說即是無信度無效度。 信度和效度及其影響因素 之關係 一、信度和效度的關係 情況一,彈痕分散於靶內各處,並無一致性可言,以衡量 的術語來說即是無信度無效度。 情況二,雖然彈痕很集中,即具有一致性,但是並沒有在 靶中心,以衡量的觀點來看,則是有信度無效度。 情況三,才是好的衡量,同時具有效度及信度。
信度和效度及其影響因素 之關係 二、影響信度效度之因素
量表之信度與效度 潛在變數的衡量,通常是以量表或問卷做為測量工具,評估量表優良與否的準則為信度與效度。 壹、信度 貳、效度
信度 1/2 信度係指測驗結果(受試者的回答)的穩定性及可靠性(可相信的程度)。信度的衡量有三種類型:穩定性、等值性與內部一致性。 穩定性:用同一種測驗對同一群受試者,前後施測兩次,然後依據兩次測驗分數計算相關係數。 等值性:交替使用一套測驗的多種複本,再根據一群受試者每個人在各種複本測驗之得分,計算相關 係數。 內部一致性:指量表能否測量單一概念,同時反映組成量表題項之內部一致性程度。
信度 2/2 量表信度的考驗方法為 Cronbach α係數,判定α係數之準則如下: 所有問卷題目一起執行計算 Cronbach α係數。 各題目單獨逐題檢查。 每個因素構面針對其所屬問卷題目,執行計算Cronbach α係數。 範例一
範例一 某研究設計一份有關“商店服務屬性”之問卷初稿,為慎重起見,選取30位受測者進行前測(結果如資料檔:服務屬性前測.sav)。請問這些題項在測試結果後,是否具備內部一致性? 1.點選Analyze/scale/reliability analysis 2.程式操作 3.分析結果
範例一 2.程式操作
分析結果 1/2 α係數=0.7984,代表十五道題目測量結果之內部一致性具高可信度。若是想要再提高信度,可由”Corrected Item-Total correlation”及”Cronbach Alpha if item Deleted”兩欄數字來判斷刪除那些題目可提高內部一致性,價格的”Corrected Item-Total correlation”數字 -0.0693 表示「價格」與總分間的相關非常的低,如果將之刪除,則可提高α係數至0.8156。
分析結果 2/2
效度 1/2 量表的效度類型有三種:內容效度、效標關聯效度與建構效度。 內容效度 內容效度是指測量內容的適切性。 效標關聯效度 效標關聯效度是指測量工具的內容具有預測或估計的能力。
效度 2/2 建構效度 建構效度(或稱構念效度)指問卷或量表能測量到理論上的構念或特質之程度。建構效度有兩類:收斂效度與區別效度。而檢測量表是否具備建構效度,最常使用之方法為因素分析法。同一因素構面中,若各題目之因素負荷量(factor loading)愈大(一般以大於0.5為準),則愈具備「收斂效度」。若問卷題目在非所屬因素構面中,其因素負荷量愈小(一般以低於0.5為準),則愈具備「區別效度」。 範例二 範例三
範例二 某研究探討有關大賣場”商店服務屬性”所應包含的內容,該研究藉由文獻回顧及專家學者的刪選,設計十五道題目並以五等量表為衡量尺度的問卷,以衡量”商店服務屬性”。今抽取97位受訪者,請其填寫問卷。請問該測量結果對於”商店服務屬性”的內容,是否具備建構效度? (資料檔:商店服務屬性.sav) 1.點選 Analyze/Data Reduction/Factor 2.程式操作 3.分析結果
範例二 2.程式操作
分析結果-1 KMO=0.806,Bartlett’s test Chi-sq = 426.339 (Sig=0.000<0.05),代表資料適合進行因素分析。 總變異量的解釋,在Principal components的方法及eigenvalue>1的原則萃取下,共萃取出五個因素,累積解釋變異量達65.041%。
分析結果-2 因素一包含6個變數,但「商店印象」問項在因素一中之負荷量小於0.5,不具收斂效度,且其在因素二中之負荷量亦達0.457,也不具備區別效度。至於「品質」問項亦有相同問題,因此必須將此兩變項刪除,重新執行因素分析。
分析結果-3 重新執行結果如下,十三個題項共萃取出四個因素構面,累積解釋變異量為61.814%,雖較先前降低些,但各題項在所屬的因素構面中,其因素負荷量皆大於0.5,同時在其他因素構面中則皆小於0.5,所以此測量結果,在因素分析方法下,將”商店服務屬性”分成四個構面,是具備建構效度的。
範例三 回收的問卷在執行效度分析後,須對每一因素構面進行信度分析,由範例二中已找出各因素構面,現今檢測各構面之信度。 1.點選 Analyze/scale/reliability analysis 2.程式操作 3.分析結果
範例三 2.程式操作
分析結果-1 構面一: 服務態度、整齊乾淨、氣氛服務、內外裝潢、結帳速度、信賴度,得到因素一之α=0.828。 構面二: 購物便利、取得便利、廣告吸引,得到因素二之α=0.588。 構面三: 售後服務、營業時間,得到因素三之α=0.524。 構面四: 價格、種類多寡,得到因素四之α=0.446。
分析結果-2 將因素分析法所萃取之構面及其效度與信度整理如下表: 因素一之α係數為0.828,已達高可信度;因素二與因素三之α係數值皆大於0.5,其信度為尚可接受;因素四之可靠度稍嫌不足,但亦未達拒絕的程度。