第五章 多變量分析總論與 信度分析 第一節 統計檢定與P值 第二節 多變量分析程序總論 第三節 信度分析與效度分析的原理 第五章 多變量分析總論與 信度分析 第一節 統計檢定與P值 第二節 多變量分析程序總論 第三節 信度分析與效度分析的原理 第四節 SPSS 的信度分析 第五節 信度分析範例
第一節 統計檢定與P值 一、常態分配與假設檢定 二、顯著水準(α值)與機率值(p值,Sig值)
常態分配與假設檢定 統計方法討論的目的是要經由樣本統計量(Statistics)推估出母體參數(Parameter)。 統計方法的另一目的是在討論有關母體參數的假設檢定。 例如:令變數為學生體重減去在相同年齡,隨機抽取9名學生隨機抽取,並計算其X值,X值分別為 -7 -2 1 3 6 10 15 21 30,其平均值為8.56。 H0:μ=0,我們稱之為虛無假設(Null hypothesis)。
圖5-1 值與P值之關係圖
P值顯著水準的表示法 p=.6453 (未達到α=.10的水準) p=.1250 (未達到α=.10的水準)
單尾與雙尾檢定 在SPSS統計軟體中,不論是哪一個檢定程序,其所顯示的P值,皆是雙尾檢定的結果。 檢定H0:μ1≦ μ2,當t值≧0時,則單尾的P值=P值(雙尾)/2 若是t值≦0,則單尾的P值=1-P值(雙尾)/2 檢定H0:μ1≧μ2 ,當t值≧ 0時,則單尾的P值=1-P值(雙尾)/2 若是t值≦ 0,則單尾的P值= P值(雙尾)/2
第二節 多變量分析程序總論 一、變數的衡量尺度之比較 二、多變量分析技術之比較
一、變數的衡量尺度之比較 名目尺度(Nominal Scale):又稱為名義尺度,如性別、居住地、職業等。 順序尺度(Ordinal Scale):又稱為次序尺度,如滿意程度、同意程度、態度、名次等。 區間尺度(Interval Scale):如溫度等。區間尺度之衡量水準高於名目尺度及順序尺度。 比率尺度(Ratio Scale):指可以表示所衡量事物的實質差異程度的數字,如成績、所得、身高、體重等。
變數的類型(1/2) 以變數尺度來區分:分為名目、順序、區間、比率四種尺度。虛(Dummy)變數,通常是指名目尺度。 以變數型態來區分:分為數字(Numeric)與文字(Character)變數。 以變數是否為類別來區分:名目與順序尺度皆可是分類(Class)變數。 以變數功能來區分:可分為自變數(Independent,又稱為獨立變數)與因變數(Dependent,又稱為應變數或相依變數)。自變數又可稱為預測(Predicted)變數,因變數又可稱為準則(Criterion)變數。
變數的類型(2/2) 以變數是否為可計量來區分:可分為計質(Quality,定性)變數與計量(Quantity,定量)變數。 計質變數包括名目尺度與順序尺度變數;計量變數包括區間尺度與比率尺度變數及升級後的順序尺度變數。 計質變數又可稱間斷(Discrete)變數,計量變數又稱為連續(Continuous)變數。 計量變數也可稱為可計量(Metric)變數或分析變數,計質變數也可稱為不可計量(Nonmetric)變數。
表5-1 變數種類的綜合比較表
二、多變量分析技術之比較 多變量分析技術的區分可從下列五個構面來劃分: 1.橫斷面與縱斷面技術分析。 2.變數是否可分為自變數與因變數。 3.自變數與因變數之個數。 4.自變數與因變數之尺度。 5.若預測變數為分類變數,群組數的多寡。 多變數技術首先以時間來劃分為同一時間點的橫斷面(cross-section)與跨時間的縱斷面(longitudinal)技術 大多數的多變量分析技術為橫斷面分析,時間數列(time-series)分析為縱斷面分析,在第十五章的第二節中討論。
表5-2 多變量分析技術彙總 比較表 (1/2)
表5-2 多變量分析技術彙總 比較表 (2/2)
表5-3 變數個數與衡量尺度的多變量分析技術比較表 表5-3 變數個數與衡量尺度的多變量分析技術比較表
表5-4 變數個數與衡量尺度的多變量分析技術比較表(續) 表5-4 變數個數與衡量尺度的多變量分析技術比較表(續)
分類變數與計量變數的資料來源 分類變數(二組或二組以上)的資料來源有三: 計量變數的資料來源: 1. 原始變數的衡量尺度即為分類變數(名目或順序尺度)。 2. 將計量變數以第二章的Recode指令重新編碼為分類變數。 3. 透過集群分析並將分群結果Save成分類變數。 計量變數的資料來源: 1. 原始變數的衡量尺度即為計量變數。 2. 將多個計量變數以主成份分析或因素分析簡化,並以Save 儲存,儲存後的變數通常為已標準化後的因素。 3. 透過MDS將簡化後的構形圖之座標值當作計量變數。
第三節 信度分析與效度分析的原理 一、信度分析的原理 二、效度分析的原理 三、量表設計之注意事項
一、信度分析的原理 評估一個系統的信度是以組成此系統的各個項目(Item)或量測之間的相關係數為基礎。 在社會與行為科學研究中,在理論模型中的變數通常很難衡量,可稱為潛在變數(latent variable),例如:績效、滿意度、忠誠度、績效、離職意願等。 故必須設計出足以衡量這些潛在變數的衡量變數(measurement variable)、觀察變數(observed variable)或稱外顯變數(manifest variable)。
信度分析的意義 所謂信度也稱為可靠度,指的是一份量表所測得的分數之一致性(consistency)與穩定性(stability)。 假設在衡量潛在變數時,量測後所得到的衡量分數(measurement score,x)與真實分數(true score,T)不相等,其差異為誤差分數(error score,E),x=T+E,誤差愈小信度愈高。信度可定義如下: 1. 衡量分數與真實分數T相關係數平方,即 2.真實分數的變異數占衡量分數的變異數之比例,亦 即: 信度係數的種類與衡量方法, 主要分成再測信度、複本信度、折半信 度與Cronbach α信度。
再測信度(不同時間,相同測驗) (Retest Reliability) 使用同一份衡量量表,對同一群受訪者,在不同的時間前後測試兩次,這種相關係數又稱穩定係數。 如兩次衡量相隔太短,受測時間者記憶猶新; 但兩次衡量時間如相隔太久,則受測者受心智成長的影響,穩定係數也可能會降低。 再測信度在實務上只適用在固定樣本研究(Panel Study)。
複本信度(不同時間,不同測驗) (Alternative-Form Reliability) 當某一套量表有兩種以上版本時可以交替使用,可避免再測信度的缺點。 複本是指內容相似、難易度相當的兩份量表。 複本信度的變異來源是受測者在兩種不同版本量表的得分差異,差異的存在是因為量表的內容造成,而非時間所造成。 複本法是信度量測的一種好方法,但要編製複本量表有時相當困難。
折半信度(相同時間,不同測驗) (Split-Half Reliability) 如果沒有複本且只能施測一次的話,可將題目分成兩半,分別計算這兩半的總分及相關係數 最好這兩半的題目內容性質與難易度能夠盡可能一致。 在折半法的優點:只需舉行一次衡量。 但折半法的缺點:折半法需將一份量表分成兩半,分法有很多種,不同的分法所得信度可能不一樣。
Cronbach α係數(1/2) Cronbach於1951年提出計算一份問卷或測驗的衡量工具之信度稱為Cronbach α係數(簡稱α係數,或稱為alpha係數),是目前社會科會研究最常使用的信度。 設一份量表包括n個項目,x1 , ..., xn,假設這n個xi分數都與真實分數T有關,即每一個項目除與T有關外,也有獨立的誤差項Ei。 令量表總和為
Cronbach α係數(2/2) 當題目間的相關係數愈大時,α係數也會愈大。當題目數n愈多時,α係數也會愈接近於1。 若只有一個題目,則信度值為1。 要作信度分析須先檢查每個問項是否都是同方向的,即都是正面問法,如果有一題與其他題的相關係數都是負的,應考慮將此題先「變號或刪除」後再進行計算α係數。 α係數的優點是只需衡量一次。 可以根據原始資料或標準化後的資料分別加以計算。 Cronbach α係數,在基礎研究中,信度至少應達到.80才可接受;在探索性研究中,信度只要達到.70就可接受。 實務上,α值只要.60,即可宣稱該衡量工作信度是可接受
二、效度分析的原理 效度也稱為正確性,是表示一份量表能真正衡量到該量表所要衡量的能力或功能之程度。 如果在智力測驗中以英文命題,結果學生不會填答,有可能是他的英文能力不好的緣故,那就測不出學生真正的智力了。 因 ,信度的平方根是效度的上限 。 故信度低則效度亦低,有效度保證有信度,反之,有信度並不保證有效度。
信度與效度的差別
內容效度(content validity) 乃指問卷的內容是具有相當高的代表性,即包括被衡量構念所有層面的項目。 若問卷內容係以理論為基礎,並參考以往學者類似研究之問卷內容加以修訂,且進行過預試(pretest),即可認為具有相當的內容效度。 有時也稱為表面效度(face validity)。
效標關聯效度 (criteria-related validity) 預測效度(predictive validity):如果效標資料需要衡量完成之後才能蒐集者,則預測效度乃用來衡量衡量結果與未來效標的相關程度。例如:編製「成就動機測驗」量表,即可用來「預測」未來該生的成就,以未來成就當作效標。 同時效度(concurrent):如果效標資料可在衡量的同時一起蒐集,可用來衡量衡量結果與目前效標的相關程度。
建構效度 (construct validity) (1/2) 指衡量工具所能衡量到理論構念的程度,所謂建構即構念 。 它是社會科學研究中所涉及之抽象的概念或變數,如成就動機、忠誠度、焦慮、滿意度、績效等。 建構效度可分為收斂和區別效度(Convergent & Discrimimant Validity)。來自於相同構念的項目,彼此之間的相關要愈高愈好,稱為收斂效度;但屬於不同構念的項目,彼此之間的相關要愈低愈好,稱為區別效度。 通常須使用Multitrait & Multimethod法來檢定,故需以不同的方法(method)來衡量同一個異質的特質(hetero-trait)。
建構效度 (construct validity) (2/2) Kerlinger指出,可用:(1)因素分析;(2)總分和項目分數之相關(part-whole correlation)來驗證問卷之建構效度。 在因素分析法中須比較該研究抽取的因素是否和以前學者所抽取的因素相同,及每個因素所包含的項目是否相同。 由於part-whole correlation即為SPSS信度分析中的Item-Total分析,故目前大部分學者認為,part-whole相關並不是效度而是信度的衡量。 建構效度通常很難加以衡量,除非是舊有量表再次施測後,以因素分析來驗證其構念是否與以前一致,或者運用結構方程模式(SEM)來進行驗證性因素分析(confirmatory factor analysis)。
效度值可以計算嗎? 效度值可以計算嗎? 每一種效度皆很難衡量,亦即很難驗證量表能夠衡量到真正要衡量的構念。 因為沒有方法可真正保證衡量到要衡量的構念。 故學術論文中,通常只能透過強調量表設計程序經過嚴謹的過程,或經過專家修正及經過預測,來強化其具有效度,但這也只是內容效度而已。 真正的效標關聯效度與建構效度仍是難以衡量。
三、量表的發展過程 步驟1 提出足夠的衡量項目。 步驟2 預試以刪除不佳的項目。 步驟3 選取內部一致性的項目。 步驟4 建立正式衡量量表。 步驟1 提出足夠的衡量項目。 步驟2 預試以刪除不佳的項目。 步驟3 選取內部一致性的項目。 步驟4 建立正式衡量量表。 步驟5 若還不滿意回到步驟1,反覆地進行。
量表設計的精確性(1/2) 1. 問項是否符合研究假設的需要。 2. 題目不宜過長,應以精簡、易於閱讀為原則。 3. 問卷設計的用字不能含糊要明確。 4. 問項不能超出填答者的知識和能力。 5. 任何一個備選答案皆不能有多重意義或包含關係。 6. 一個問項不能有兩個以上的觀念或事物。 7. 問項盡量以封閉式而非開放式的方式來填答。
量表設計的精確性(2/2) 8. 問項不能涉及社會禁忌與隱私。 9. 問項應盡量保持客觀中立的原則。 10. 避免誘導回答或暗示回答的問題。 11. 內容順序與類別順序:客觀的「行為」問題在前,主觀的「意見與態度」在後。 12. 使用反向題:在衡量量表中插入幾題反向題,以Compute指令將反向題予以反正。但若只有少數的反向題插入許多的正向題中,亦容易因填答者的草率而當成正向題來處理。
量表的形式 量表的形式中,最常被使用的衡量格式是類別性(categorial)題目。 如果是連續性的衡量,以Likert(李克特)量表最常被使用。 Likert量表,每個題目皆有標示衡量填卷者強弱程度的尺度,例如:5非常同意、4同意、3普通、2不同意、1非常不同意,分數愈高代表同意程度愈高。 其最適刻度以五或七點尺度的奇數格最多,但缺點是受訪者容易選擇中間選項。 Likert量表雖為順序尺度,但多半視為區間尺度,故該量表必須先經過信度的檢定。 除了Likert量表外,尚有Thurstone量表、Guttman量表等。
第四節 SPSS 的信度分析 一、操作步驟 二、結果輸出 三、結果製表與解釋 四、折半信度的計算
5-2 Reliability Analysis對話框
5-3 Reliability Analysis: Statistics子對話框 Scale if item deleted:這選項經常會被使用到,可用來判斷哪個變數將會降低信度值。
Cronbach's α值 在本範例中,標準化前的信度值為.871,標準化後的信度值為.887,代表信度值相當高;這表示期初、期中與期末成績三者有相當高的一致性。
Item與Scale統計量
Item-Total 統計輸出
Item-Total 的輸出
Summaries的輸出
ANOVA表
Hotelling's T-Squared 檢定表
Intraclass Correlation Coefficient檢定表
表5-4 Item-Total的信度分析表 從「Item-Total之相關係數」可知,期初成績與其中成績兩個項目與三個成績的合計值較期末成績高。 從「複相關係數平方」也顯示期末成績與其他兩個成績項目的相關較低。 從「刪除此題目後之值」也可知刪除期末成績後的值可提升至0.899 。 從這三個統計量皆顯示若要刪除某個項目來提高信度值,則首先最該刪除的是「期末成績」。
折半信度的計算(1/2)
折半信度的計算(2/2)
第五節 信度分析範例 一、客戶關係管理(CRM) 二、終端使用者應用(EUC)
表5-5 CRM系統功能之衡量構面、問卷題數與信度值分析表
表5-6 EUC管制措施與推廣措施之信度分析表結果