第五章 多變量分析總論與 信度分析 第一節 統計檢定與P值 第二節 多變量分析程序總論 第三節 信度分析與效度分析的原理

Slides:



Advertisements
Similar presentations
©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
Advertisements

變數與函數 大綱 : 對應關係 函數 函數值 顧震宇 台灣數位學習科技股份有限公司. 對應關係 蛋餅飯糰土司漢堡咖啡奶茶 25 元 30 元 25 元 35 元 25 元 20 元 顧震宇 老師 台灣數位學習科技股份有限公司 變數與函數 下表是早餐店價格表的一部分: 蛋餅 飯糰 土司 漢堡 咖啡 奶茶.
Survey Sampling 問卷調查和訪談
單元九:單因子變異數分析.
實驗規劃--實驗因子設定, 效標選定與受測者選定
資料概說 1.1 基本名詞介紹 1.2 資料型態 1.3 基本操作 商管研究資料分析SPSS的應用 Chapter 1 資料概說.
項目分析與信度估計 (Item Analysis and Reliability Estimation )
《传播统计学》 作者:柯惠新 祝建华 孙江华.
樞紐分析與資料庫 蕭世斌 Nov 20, 2010.
Ch.13 資料分析方法介紹 陳碩珮.
第 3 章 資料分類與蒐集 1.進行研究過程中最重要的步驟 2.資料收集與實驗設計具有關連性.
生物醫學統計學.
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
行銷研究 單元二 行銷研究的程序.
應用統計學 授課大綱 – 暑期班 By: Dr. Tsung-Nan Tsai.
第二章 研究设计与评价.
第7章 量表的建立—補充 4.1 基本觀念 4.2 測量程序 4.3 測量尺度 4.4 良好測量工具的特性 4.5 信度測量
多變量分析 Multivariant Analysis
17 類別資料的分析  學習目的.
第一章 统计学及其基本概念 南京财经大学统计学系.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
陳維魁 博士 儒林圖書公司 第九章 資料抽象化 陳維魁 博士 儒林圖書公司.
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
第十三章 調查研究.
第四章 测试效度及其 验证方法(一) 湖南师范大学外国语学院 邓 杰 教授.
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
1.問卷調查研究設計簡介 2.問卷資料分析~項目分析與信效度檢驗 3.問卷資料分析~因素分析 4.因果關係分析~結構方程模式分析
結構方程模式 結構方程模式由測量模型(measurement model)及結構模型(structural model)所組成。
第8章 態度的衡量與信度、效度的檢定 本章的學習主題 1.衡量的意義 2.衡量的尺度 3.衡量的指標 4.衡量尺度與統計分析 5.態度的意義 6.態度的衡量尺度 7.信度與效度的意義 8.衡量的誤差來源 9.信度與效度與其他相關因素的關係.
REGRESSION FOR ORDINAL OUTCOMES 「順序尺度依變項」的迴歸模型
第十三章 量表的發展,信度和效度 13-1 量表的發展 13-2 量表的信度和效度 13-3 量表發展實例
課程九 迴歸與相關2.
第十四章 信度.
類別(class) 類別class與物件object.
第8章 衡量方法及信度與效度的檢定  本章的學習主題  1.衡量的意義 2.衡量的尺度 3.衡量的指標 4.衡量尺度與統計分析
第二章 SPSS的使用 2.1 啟動SPSS系統 2.2 結束SPSS系統 2.3 資料分析之相關檔案 2.4 如何使用SPSS軟體.
Java 程式設計 講師:FrankLin.
第十一章 相關研究法.
指導老師: 蘇明俊 老師 組長:潘翠娥 組員:張惠雅 葉麗華
論文計畫書 國軍人員對廢軍品管理現況之研究─以空軍 後勤單位為例 指導教授:胡子陵博士 研究生:劉俊德.
量表之信度與效度 潛在變數的衡量,通常是以量表或問卷作為測量工具,評估量表優良與否的準則為信度與效度。 11.1 信度 11.2 效度
第四章 测试效度及其 验证方法(一) 湖南师范大学外国语学院 邓 杰 教授.
第二版 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第四單元:實驗設計資料 (2) 授課教師:國立臺灣大學政治學系 洪永泰 教授
估計與假設檢定.
有關於股票報酬及匯率變化對台灣醫療產業市場收益的分析
小學四年級數學科 8.最大公因數.
信度分析 (11/7~11/13) 1.何謂『信度』 2.信度分析步驟.
Chapter 1 多變量統計方法介紹. Chapter 1 多變量統計方法介紹 變數資料之類型 以衡量尺度分類 以變數的角色分類 名目尺度(nominal scale ) 序列尺度(ordinal scale) 區間尺度(interval scale) 比率尺度(ratio scale) 以變數的角色分類.
學習內容 概說 損失函數 雜音:造成品質變異的原因 訊號雜音比 直交表 回應表與回應圖 田口方法.
信度效度分析.
Measurement in Research
報告人: 范誠達 指導老師:任維廉 教授 日期:2010/5/4
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
SPSS信度分析 祝天雄 博士
Development of the Standardized Tests
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
Measurement Theory and Method
第八章 銷售預測(2).
第十章 態度量表(問卷設計).
Chapter 13 測量之信度與效度分析. Chapter 13 測量之信度與效度分析 潛在變數與衡量變數的關係 在理論模型中的變數,通常很難直接衡量,我們稱為潛在變數(latent variables) 我們必須找尋或設計出足以代表這些潛在變數的衡量指標,而這些指標則稱為衡量變數(measurement.
資料表示方法 資料儲存單位.
第一節 餐飲服務的定義及範圍 4-2 鋸條的種類、用途與規則 一. 鋸條規格 二. 鋸條的種類 三. 鋸條的用途.
假說檢定程序 3.1 定義 3.2 假說檢定程序 3.3 檢定的種類與方法 3.4 統計檢定精神 個案:假說建立
Chapter 1 多變量統計方法介紹. Chapter 1 多變量統計方法介紹 變數資料之類型 以衡量尺度分類 以變數的角色分類 名目尺度(nominal scale ) 序列尺度(ordinal scale) 區間尺度(interval scale) 比率尺度(ratio scale) 以變數的角色分類.
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
97學年度第二學期水保系碩專班專題報告 農生再生試辦區之分析探討 報告人:簡榮杰.
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
Presentation transcript:

第五章 多變量分析總論與 信度分析 第一節 統計檢定與P值 第二節 多變量分析程序總論 第三節 信度分析與效度分析的原理 第五章 多變量分析總論與 信度分析 第一節 統計檢定與P值 第二節 多變量分析程序總論 第三節 信度分析與效度分析的原理 第四節 SPSS 的信度分析 第五節 信度分析範例

第一節 統計檢定與P值 一、常態分配與假設檢定 二、顯著水準(α值)與機率值(p值,Sig值)

常態分配與假設檢定 統計方法討論的目的是要經由樣本統計量(Statistics)推估出母體參數(Parameter)。 統計方法的另一目的是在討論有關母體參數的假設檢定。 例如:令變數為學生體重減去在相同年齡,隨機抽取9名學生隨機抽取,並計算其X值,X值分別為 -7 -2 1 3 6 10 15 21 30,其平均值為8.56。 H0:μ=0,我們稱之為虛無假設(Null hypothesis)。

圖5-1 值與P值之關係圖

P值顯著水準的表示法 p=.6453 (未達到α=.10的水準) p=.1250 (未達到α=.10的水準)

單尾與雙尾檢定 在SPSS統計軟體中,不論是哪一個檢定程序,其所顯示的P值,皆是雙尾檢定的結果。 檢定H0:μ1≦ μ2,當t值≧0時,則單尾的P值=P值(雙尾)/2 若是t值≦0,則單尾的P值=1-P值(雙尾)/2 檢定H0:μ1≧μ2 ,當t值≧ 0時,則單尾的P值=1-P值(雙尾)/2 若是t值≦ 0,則單尾的P值= P值(雙尾)/2

第二節 多變量分析程序總論 一、變數的衡量尺度之比較 二、多變量分析技術之比較

一、變數的衡量尺度之比較 名目尺度(Nominal Scale):又稱為名義尺度,如性別、居住地、職業等。 順序尺度(Ordinal Scale):又稱為次序尺度,如滿意程度、同意程度、態度、名次等。 區間尺度(Interval Scale):如溫度等。區間尺度之衡量水準高於名目尺度及順序尺度。 比率尺度(Ratio Scale):指可以表示所衡量事物的實質差異程度的數字,如成績、所得、身高、體重等。

變數的類型(1/2) 以變數尺度來區分:分為名目、順序、區間、比率四種尺度。虛(Dummy)變數,通常是指名目尺度。 以變數型態來區分:分為數字(Numeric)與文字(Character)變數。 以變數是否為類別來區分:名目與順序尺度皆可是分類(Class)變數。 以變數功能來區分:可分為自變數(Independent,又稱為獨立變數)與因變數(Dependent,又稱為應變數或相依變數)。自變數又可稱為預測(Predicted)變數,因變數又可稱為準則(Criterion)變數。

變數的類型(2/2) 以變數是否為可計量來區分:可分為計質(Quality,定性)變數與計量(Quantity,定量)變數。 計質變數包括名目尺度與順序尺度變數;計量變數包括區間尺度與比率尺度變數及升級後的順序尺度變數。 計質變數又可稱間斷(Discrete)變數,計量變數又稱為連續(Continuous)變數。 計量變數也可稱為可計量(Metric)變數或分析變數,計質變數也可稱為不可計量(Nonmetric)變數。

表5-1 變數種類的綜合比較表

二、多變量分析技術之比較 多變量分析技術的區分可從下列五個構面來劃分: 1.橫斷面與縱斷面技術分析。 2.變數是否可分為自變數與因變數。 3.自變數與因變數之個數。 4.自變數與因變數之尺度。 5.若預測變數為分類變數,群組數的多寡。 多變數技術首先以時間來劃分為同一時間點的橫斷面(cross-section)與跨時間的縱斷面(longitudinal)技術 大多數的多變量分析技術為橫斷面分析,時間數列(time-series)分析為縱斷面分析,在第十五章的第二節中討論。

表5-2 多變量分析技術彙總 比較表 (1/2)

表5-2 多變量分析技術彙總 比較表 (2/2)

表5-3 變數個數與衡量尺度的多變量分析技術比較表 表5-3 變數個數與衡量尺度的多變量分析技術比較表

表5-4 變數個數與衡量尺度的多變量分析技術比較表(續) 表5-4 變數個數與衡量尺度的多變量分析技術比較表(續)

分類變數與計量變數的資料來源 分類變數(二組或二組以上)的資料來源有三: 計量變數的資料來源: 1. 原始變數的衡量尺度即為分類變數(名目或順序尺度)。 2. 將計量變數以第二章的Recode指令重新編碼為分類變數。 3. 透過集群分析並將分群結果Save成分類變數。 計量變數的資料來源: 1. 原始變數的衡量尺度即為計量變數。 2. 將多個計量變數以主成份分析或因素分析簡化,並以Save 儲存,儲存後的變數通常為已標準化後的因素。 3. 透過MDS將簡化後的構形圖之座標值當作計量變數。

第三節 信度分析與效度分析的原理 一、信度分析的原理 二、效度分析的原理 三、量表設計之注意事項

一、信度分析的原理 評估一個系統的信度是以組成此系統的各個項目(Item)或量測之間的相關係數為基礎。 在社會與行為科學研究中,在理論模型中的變數通常很難衡量,可稱為潛在變數(latent variable),例如:績效、滿意度、忠誠度、績效、離職意願等。 故必須設計出足以衡量這些潛在變數的衡量變數(measurement variable)、觀察變數(observed variable)或稱外顯變數(manifest variable)。

信度分析的意義 所謂信度也稱為可靠度,指的是一份量表所測得的分數之一致性(consistency)與穩定性(stability)。 假設在衡量潛在變數時,量測後所得到的衡量分數(measurement score,x)與真實分數(true score,T)不相等,其差異為誤差分數(error score,E),x=T+E,誤差愈小信度愈高。信度可定義如下: 1. 衡量分數與真實分數T相關係數平方,即 2.真實分數的變異數占衡量分數的變異數之比例,亦 即: 信度係數的種類與衡量方法, 主要分成再測信度、複本信度、折半信 度與Cronbach α信度。

再測信度(不同時間,相同測驗) (Retest Reliability) 使用同一份衡量量表,對同一群受訪者,在不同的時間前後測試兩次,這種相關係數又稱穩定係數。 如兩次衡量相隔太短,受測時間者記憶猶新; 但兩次衡量時間如相隔太久,則受測者受心智成長的影響,穩定係數也可能會降低。 再測信度在實務上只適用在固定樣本研究(Panel Study)。

複本信度(不同時間,不同測驗) (Alternative-Form Reliability) 當某一套量表有兩種以上版本時可以交替使用,可避免再測信度的缺點。 複本是指內容相似、難易度相當的兩份量表。 複本信度的變異來源是受測者在兩種不同版本量表的得分差異,差異的存在是因為量表的內容造成,而非時間所造成。 複本法是信度量測的一種好方法,但要編製複本量表有時相當困難。

折半信度(相同時間,不同測驗) (Split-Half Reliability) 如果沒有複本且只能施測一次的話,可將題目分成兩半,分別計算這兩半的總分及相關係數 最好這兩半的題目內容性質與難易度能夠盡可能一致。 在折半法的優點:只需舉行一次衡量。 但折半法的缺點:折半法需將一份量表分成兩半,分法有很多種,不同的分法所得信度可能不一樣。

Cronbach α係數(1/2) Cronbach於1951年提出計算一份問卷或測驗的衡量工具之信度稱為Cronbach α係數(簡稱α係數,或稱為alpha係數),是目前社會科會研究最常使用的信度。 設一份量表包括n個項目,x1 , ..., xn,假設這n個xi分數都與真實分數T有關,即每一個項目除與T有關外,也有獨立的誤差項Ei。 令量表總和為

Cronbach α係數(2/2) 當題目間的相關係數愈大時,α係數也會愈大。當題目數n愈多時,α係數也會愈接近於1。 若只有一個題目,則信度值為1。 要作信度分析須先檢查每個問項是否都是同方向的,即都是正面問法,如果有一題與其他題的相關係數都是負的,應考慮將此題先「變號或刪除」後再進行計算α係數。 α係數的優點是只需衡量一次。 可以根據原始資料或標準化後的資料分別加以計算。 Cronbach α係數,在基礎研究中,信度至少應達到.80才可接受;在探索性研究中,信度只要達到.70就可接受。 實務上,α值只要.60,即可宣稱該衡量工作信度是可接受

二、效度分析的原理 效度也稱為正確性,是表示一份量表能真正衡量到該量表所要衡量的能力或功能之程度。 如果在智力測驗中以英文命題,結果學生不會填答,有可能是他的英文能力不好的緣故,那就測不出學生真正的智力了。 因 ,信度的平方根是效度的上限 。 故信度低則效度亦低,有效度保證有信度,反之,有信度並不保證有效度。

信度與效度的差別

內容效度(content validity) 乃指問卷的內容是具有相當高的代表性,即包括被衡量構念所有層面的項目。 若問卷內容係以理論為基礎,並參考以往學者類似研究之問卷內容加以修訂,且進行過預試(pretest),即可認為具有相當的內容效度。 有時也稱為表面效度(face validity)。

效標關聯效度 (criteria-related validity) 預測效度(predictive validity):如果效標資料需要衡量完成之後才能蒐集者,則預測效度乃用來衡量衡量結果與未來效標的相關程度。例如:編製「成就動機測驗」量表,即可用來「預測」未來該生的成就,以未來成就當作效標。 同時效度(concurrent):如果效標資料可在衡量的同時一起蒐集,可用來衡量衡量結果與目前效標的相關程度。

建構效度 (construct validity) (1/2) 指衡量工具所能衡量到理論構念的程度,所謂建構即構念 。 它是社會科學研究中所涉及之抽象的概念或變數,如成就動機、忠誠度、焦慮、滿意度、績效等。 建構效度可分為收斂和區別效度(Convergent & Discrimimant Validity)。來自於相同構念的項目,彼此之間的相關要愈高愈好,稱為收斂效度;但屬於不同構念的項目,彼此之間的相關要愈低愈好,稱為區別效度。 通常須使用Multitrait & Multimethod法來檢定,故需以不同的方法(method)來衡量同一個異質的特質(hetero-trait)。

建構效度 (construct validity) (2/2) Kerlinger指出,可用:(1)因素分析;(2)總分和項目分數之相關(part-whole correlation)來驗證問卷之建構效度。 在因素分析法中須比較該研究抽取的因素是否和以前學者所抽取的因素相同,及每個因素所包含的項目是否相同。 由於part-whole correlation即為SPSS信度分析中的Item-Total分析,故目前大部分學者認為,part-whole相關並不是效度而是信度的衡量。 建構效度通常很難加以衡量,除非是舊有量表再次施測後,以因素分析來驗證其構念是否與以前一致,或者運用結構方程模式(SEM)來進行驗證性因素分析(confirmatory factor analysis)。

效度值可以計算嗎? 效度值可以計算嗎? 每一種效度皆很難衡量,亦即很難驗證量表能夠衡量到真正要衡量的構念。 因為沒有方法可真正保證衡量到要衡量的構念。 故學術論文中,通常只能透過強調量表設計程序經過嚴謹的過程,或經過專家修正及經過預測,來強化其具有效度,但這也只是內容效度而已。 真正的效標關聯效度與建構效度仍是難以衡量。

三、量表的發展過程 步驟1 提出足夠的衡量項目。 步驟2 預試以刪除不佳的項目。 步驟3 選取內部一致性的項目。 步驟4 建立正式衡量量表。 步驟1 提出足夠的衡量項目。 步驟2 預試以刪除不佳的項目。 步驟3 選取內部一致性的項目。 步驟4 建立正式衡量量表。 步驟5 若還不滿意回到步驟1,反覆地進行。

量表設計的精確性(1/2) 1. 問項是否符合研究假設的需要。 2. 題目不宜過長,應以精簡、易於閱讀為原則。 3. 問卷設計的用字不能含糊要明確。 4. 問項不能超出填答者的知識和能力。 5. 任何一個備選答案皆不能有多重意義或包含關係。 6. 一個問項不能有兩個以上的觀念或事物。 7. 問項盡量以封閉式而非開放式的方式來填答。

量表設計的精確性(2/2) 8. 問項不能涉及社會禁忌與隱私。 9. 問項應盡量保持客觀中立的原則。 10. 避免誘導回答或暗示回答的問題。 11. 內容順序與類別順序:客觀的「行為」問題在前,主觀的「意見與態度」在後。 12. 使用反向題:在衡量量表中插入幾題反向題,以Compute指令將反向題予以反正。但若只有少數的反向題插入許多的正向題中,亦容易因填答者的草率而當成正向題來處理。

量表的形式 量表的形式中,最常被使用的衡量格式是類別性(categorial)題目。 如果是連續性的衡量,以Likert(李克特)量表最常被使用。 Likert量表,每個題目皆有標示衡量填卷者強弱程度的尺度,例如:5非常同意、4同意、3普通、2不同意、1非常不同意,分數愈高代表同意程度愈高。 其最適刻度以五或七點尺度的奇數格最多,但缺點是受訪者容易選擇中間選項。 Likert量表雖為順序尺度,但多半視為區間尺度,故該量表必須先經過信度的檢定。 除了Likert量表外,尚有Thurstone量表、Guttman量表等。

第四節 SPSS 的信度分析 一、操作步驟 二、結果輸出 三、結果製表與解釋 四、折半信度的計算

5-2 Reliability Analysis對話框

5-3 Reliability Analysis: Statistics子對話框 Scale if item deleted:這選項經常會被使用到,可用來判斷哪個變數將會降低信度值。

Cronbach's α值 在本範例中,標準化前的信度值為.871,標準化後的信度值為.887,代表信度值相當高;這表示期初、期中與期末成績三者有相當高的一致性。

Item與Scale統計量

Item-Total 統計輸出

Item-Total 的輸出

Summaries的輸出

ANOVA表

Hotelling's T-Squared 檢定表

Intraclass Correlation Coefficient檢定表

表5-4 Item-Total的信度分析表 從「Item-Total之相關係數」可知,期初成績與其中成績兩個項目與三個成績的合計值較期末成績高。 從「複相關係數平方」也顯示期末成績與其他兩個成績項目的相關較低。 從「刪除此題目後之值」也可知刪除期末成績後的值可提升至0.899 。 從這三個統計量皆顯示若要刪除某個項目來提高信度值,則首先最該刪除的是「期末成績」。

折半信度的計算(1/2)

折半信度的計算(2/2)

第五節 信度分析範例 一、客戶關係管理(CRM) 二、終端使用者應用(EUC)

表5-5 CRM系統功能之衡量構面、問卷題數與信度值分析表

表5-6 EUC管制措施與推廣措施之信度分析表結果