量表測量 淡江大學資管系碩士在職專班
測量 測量的定義 變數(variable)種類 數值指派的「規則」 量表(scale)的設計 「量表」設計的技術 效度 信度
測量的定義 「測量」是針對某一特定對象、人、或組織,有關某種特徵或行為(消費、所得、人格特質…),賦予其一個值,使其數值能代表(或符合)構念中所代表的概念或狀況。它是屬於衡量的問題。 「測量」就是研究者根據一定「規則」將數值(或其它符號)指派給物體或事物(變數)身上之一種程序。
測量的三個程序 (1)選擇可觀察的「個體或事物」(即「對象」 ) (2)以數字或符號代表事件的特性,即數值系統(numerical system) (3)依據指派「規則」賦予觀察值一個符號或數字,此種「規則」就是操作型定義。 *
數值系統可分四大類 名目(nominal)資料: 此種變數可做「分類」。沒有大小沒有距離。例如性別 順序(ordinal)資料: 此種變數可比大小及前後,但前後距離不等。只有大小沒有距離。例如5>4,但5-4≠1。例如,研究者常用Likert五點計分量表所得數據,可能是1~5分,亦可能是-2~+2分,這種資料屬於順序變數。
數值系統可分四大類 區間(interval)資料:具有前兩者的資料特性,且可以比較差距。前後距離相等,但沒有倍數關係,所以沒有絕對的0(有距離,但沒有絕對的零點)。例如5-4=1, 但4≠2×2。 比例(ratio)資料:具有前三者的資料特性,且可以做倍數比較。有距離,有絕對的零點。例如,4=2×2。
變數(variable)種類 自變數:在實驗法中又稱「因」(cause)變數或實驗變數,它是經由實驗者安排或操弄的變數。 依變數:在實驗法中又稱「果」(effect)變數或反應變數,它是實驗者企圖觀察測量的行為或反應。 外生(extraneous)變數:指自變數以外,凡是可能影響結果(依變數)之因素。 中介(intervening)變數:指介於自變數與依變數之間,凡是會對研究結果會產生作用的內在歷程。通常,它是不能直接觀察辨認的,只能憑個體外顯行為的線索來推知。
測量誤差 指「真正差異」以外任何引起測量分數的差異。測量誤差(誤差分數)的來源有二大類: 系統性誤差:它會對測量結果產生一致性固定的影響; 隨機性誤差:主要是來自受訪者身心狀況(情緒、性格、動機…)、情境因素(噪音、太太在場、趕飛機、太熱…)、及測量試題(內容太長、太難…)的干擾影響
系統性誤差 系統性誤差(systemtic errors)只要使用測量工具,它就會產生。系統性誤差對個案間及研究間的影響方式都是「固定」不變的。換言之,對相同情境受訪者或不同情境受訪者的同一位受訪者,均產生同樣的影響。
隨機性誤差 每一次以「不同」方式來影響測量工具的使用。隨機性誤差(又稱非系統性誤差)之主要來源,可分成下列六種因素,這些因素是施測者無法控制的:
隨機性誤差之主要來源 受測者誤差:因受測者本身特質(如隨和性)不同、當時個人的情緒好壞,都會導致測量結果的不同。例如: 老大「愛問」「蕃茄為何有紅有綠?鵝為什麼叫聲大?岳母為什麼眼睛紅?」 老二「愛答」:「蕃茄因為曬到太陽、鵝因為脖子長、岳母沒睡好」。 老三「愛質疑」:「胡蘿蔔也會曬到變紅、青蛙脖子短但叫聲也很大、母豬每天睡眼睛也會紅」。
隨機性誤差之主要來源 情境因素:訪談時任何外力的影響 施測者誤差:有許多種,例如,訪談者的解釋、重述、語氣、態度和藹可親、肢體動作、草率的資料處理…等等。 量表的使用方式:是由訪問員代填,還是受訪者親自填答。 資料的分析處理之影響。
隨機性誤差之主要來源 測量工具誤差:量表的設計及形式,包括: 測量工具內容:混淆(區別效度不佳)、語意不清(信度不佳)、編排不良(建構效度不佳)…等; 測量項目不足,未能涵蓋所欲測量的特性(即內容效度不佳)、項目的篩選 有沒有引導作答的嫌疑…等等。*
測量工具好壞的評量準則 效度:該量表是否真能測量到我們欲衡量的特性。 信度:該測量工具所衡量的結果是否具有穩定性、一致性。 敏感度:事物起了變化,該測量工具是否能顯現出差異。 實用性:即考量該測量工具的經濟性、便利性、可解釋性。
量表(scale)的設計 所謂「量表化」(scaling),它是一種測量的程序,旨在將衡量對象或欲衡量的特性(property)指派某些數值,以便將測量對象之特性數值化。 衡量「變數」可用單一問項來量 衡量「構念」則要用量表來量。量表是用一個以上的指標(indicant ,item, manifested)來測量某個體/事物的特性。
「量表」設計的技術 李克特量表,採用「評分加總」之計分方式 Thurstone量表,又稱共識量表 語意差異法 Guttman量表,採用累計量表計分方式
李克特量表 李克特(Likert)量表是屬「評分加總式量表最常用的一種,屬同一「構念」的「這些項目」是用「加總」方式來計分,單獨或個別項目是無意義的。 「評分加總式量表」是對某一概念/構念所設計的數個項目,測量每位受訪者對它們的態度反應(同意程度)。每一個反應都給一個數值,以代表受訪者對該項目的贊同程度,將每位受訪者在這些項目的得分加總,即是受訪者對該題的態度。
李克特量表 加總式量表有二個假說或特徵: 每一個態度項目都具有相同量值,但項目之間則沒有差別量值。 對同一項目而言,受訪者的反應程度是不同的(具有差別量值)。
李克特量表型式 下列各題的敘述,請依您贊成或不贊成的程度,在適當位置作記號。 非常贊成 贊成 不一定 不贊成 非常不贊成 非常贊成 贊成 不一定 不贊成 非常不贊成 1.家裡有小孩,使夫婦更為親密 □ □ □ □ □ 2.教小孩子學習各種事物是件愉快的事 □ □ □ □ □ 3.小孩子本質上有許多惡性,所以要嚴格 □ □ □ □ □ 4.照顧小孩使做母親失去許多社交機會 □ □ □ □ □ 5.當遭遇生活困境時,小孩是鼓勵與希望 □ □ □ □ □
李克特量表設計的步驟 建立大量有關某一「態度」構念之題庫,每一個陳述(statement)等於一個項目(item),並隨機式排列這些項目。 邀請一組樣本,請各受訪者對上述態度各項目表達立場 進行項目分析:旨在對量表之題庫做篩選,它是假定每一項目都具有相同的量值。項目的好壞是依據其是否具有區別力判定,被判定為較差別力之項目,則刪除它。
項目分析之方法 相關分析法:計算每一項目與總分的積差相關(以符號Rti表示),當作該題的「區別指數,區別指數偏低者,即表示該題未能區分受試者的反應程度,沒有區別效果,可予剔除。 內部一致性效標分析法:將所有受試者在預試量表得分的總和依高低分排序,然後由最高分者起算總人數的25%為高分組,由最低分者起算,總人數的25%為低分組。爾後以高分組受試者在某一項目(題)得分之平均數減低分組受試者在同一題得分之平均數,其差即代表此題的鑑別力。
Thurstone 量表 是由一群「專家」(一般50人以上)篩選項目準則來刪題 與研究主題有關聯性 題意是否模糊(即專家對該題去留意見不一致者) 項目所表達之態度層次。 Thurstone量表能否編製成功之關鍵點,是在編製過程,專家們要能去除個人情感好惡來表達其對每一項目去留之意見,接著再將專家意見(該題去留)不一致者的項目刪除
Thurstone 量表型式 spss課程學習量表: 同意 不同意 spss老師是個好人 □ □ spss對我是重要的 □ □ 同意 不同意 spss老師是個好人 □ □ spss對我是重要的 □ □ 我上spss課很認真 □ □ spss課程對我是有幫助的 □ □ 我滿意自己在spss課程上的表現 □ □
Thurstone 量表設計步驟-1 根據「研究主題」尋找相關的句子(項目)來建立量表之題庫。 Decide how to manage multiple tasks. 20 Decide how to manage multiple tasks. 20 Manage resources effectively. 4 Decide how to manage multiple tasks. 20 Manage resources effectively. 4 Manage resources effectively. 4 Decide how to manage multiple tasks. 20 Manage resources effectively. 4 Decide how to manage multiple tasks. 20 Work quickly and effectively under pressure 49 Decide how to manage multiple tasks. 20 Work quickly and effectively under pressure 49 Work quickly and effectively under pressure 49 Manage resources effectively. 4 Manage resources effectively. 4 Decide how to manage multiple tasks. 20 Decide how to manage multiple tasks. 20 Decide how to manage multiple tasks. 20 Organize the work when directions are not specific. 39 Decide how to manage multiple tasks. 20 Work quickly and effectively under pressure 49 Manage resources effectively. 4 Organize the work when directions are not specific. 39 Organize the work when directions are not specific. 39 Manage resources effectively. 4 Manage resources effectively. 4 Manage resources effectively. 4 Decide how to manage multiple tasks. 20 Organize the work when directions are not specific. 39 Work quickly and effectively under pressure 49 Manage resources effectively. 4 Work quickly and effectively under pressure 49 Work quickly and effectively under pressure 49 Work quickly and effectively under pressure 49 Work quickly and effectively under pressure 49 Organize the work when directions are not specific. 39 Work quickly and effectively under pressure 49 Organize the work when directions are not specific. 39 Organize the work when directions are not specific. 39 Work quickly and effectively under pressure 49 Organize the work when directions are not specific. 39 Organize the work when directions are not specific. 39 Organize the work when directions are not specific. 39
Thurstone 量表設計步驟-2 由專家(通常是50人以上)對這些項目表達意見,採11點計分方式。 Work quickly and effectively under pressure 49 1 2 3 4 5 6 7 8 9 10 11 Manage resources effectively. Decide how to manage multiple tasks. 20 Organize the work when directions are not specific. 39
Thurstone 量表設計步驟-3 根據回收的數據,計算每一題累積百分比,再算出每一題之四分差。 中位數 Q3-Q1 Q3 中位數 Q1
Thurstone 量表設計步驟-4~7 再根據每一個題目(項目)的四分差、中位數來選題。選題的準則為保留四分差較小者之項目約12-18題,當作未來的正式量表。 求出這12-18題目中每一題「去留」評分之中位數,此平均數即正式問卷之該題目之得分。 編製Thurstone量表的最終目標,使該量表的每一個題目的中位數均勻分配至1至11每一等級中。 對受訪者施測。
Thurstone 量表範例 同意 不同意 分數 實得 spss老師是個好人 ■ □ 0.5 0.5 ---------------------------------------------------------------------------- 總得分: 5.0 勾選同意才有分數
語意差異量表 語意差異是假設事物的意含可能有多種層面,而這些特質層面之空間,謂之語意空間,例如: 好的 1 2 3 4 5 6 7 差的 好的 1 2 3 4 5 6 7 差的 快的 1 2 3 4 5 6 7 慢的 強的 1 2 3 4 5 6 7 弱的
語意差異量表之設計步驟 先建立題庫(一組項目),並對「態度」目標物,就受訪者可能的反應,選擇其兩極化的形容詞,來橫跨「1至7」之選答區,以便受訪者填答 對受訪者所回收資料進行資料分析,計算出每題(變數)的平均數。 依據項目順序,將每題(變數)平均數集結起來,以形成整個量表之特徵輪廓
語意差異量表範例 徐師傅「泡麵」 可口的 1 2 3 4 5 6 7 難吃的 方便的 1 2 3 4 5 6 7 麻煩的 可口的 1 2 3 4 5 6 7 難吃的 方便的 1 2 3 4 5 6 7 麻煩的 便宜的 1 2 3 4 5 6 7 昂貴的 美觀的 1 2 3 4 5 6 7 醜陋的 新奇的 1 2 3 4 5 6 7 呆板的 上班族 學生
Guttman量表 由一組不同強弱程度的題目所組成,受測者在一定強度下回答同意,超過此一強度則回答不同意。同意與不同意的轉折點反映了受測者的真實態度強度或行為強度。
Guttman量表範例 是 否 計分 題目A 我接受把女兒嫁給黑人 □ □ 3 題目B 我願意到黑人家中作客 □ □ 2 是 否 計分 題目A 我接受把女兒嫁給黑人 □ □ 3 題目B 我願意到黑人家中作客 □ □ 2 題目C 我願意和黑人一起上學 □ □ 1
Guttman量表編製步驟 首先建立可以用來測量某事實之具體句子或項目。 選取一組樣本進行前測(pre-test),將那些被80%受訪者填答「同意」或「不同意」的項目刪除。約只保留3~6題。 後測時,約找100人以上受訪者對上述3至6題勾選意見。 整理後測回收資料,將彙總後的數據代入CR公式,以求出「複製係數,若CR值在0.8以上者,才可以說:「這些強烈程度題確實屬於同一構面」。
Guttman量表
CR值計算 e代表(誤差)的人數,即受訪者回答情形「不合理」的人數。 n為項目數(題數) N為受訪總人數
效度 調查結果合乎事實則稱為具有高效度 三種效度:內容效度、效標關聯效度、及建構效度。
內容效度 抽樣(sampling)效度:量表所包含的項目是否能代表母體構念的項目。內容效度的高低,端賴項目(item)取樣代表性之大小而定。 表面(face)效度:是指量表項目和形式上,給人的主觀印象,如果該量表從外表來看,似乎確實可適切地測量其欲測的特質或行為,便稱它具有表面效度。這是最容易達成及最基本的效度。此類效度就是由學界來判斷指標是否真的測量到所欲測量到的構念。
效標關聯效度 又稱實用效度或實証效度,意指這種效度應建立在實証資料之上。檢視測量指標的這種效度是要將它與測量同一構念且研究者有信心的指標來做比較。 依據效標不同,效標關聯效度可分為同時(concurrent)效標及預測(predictive) 效標,兩者皆表示測量工具(分數)和效標之間相關的程度。
效標關聯效度 同時效標:一個測量工具必須與既存且已被視為有效的指標(校標)相關連。是指測量工具與效標同時出現。例如,以「口袋中零用錢」(屬測量工具)衡量受訪者的「所得」(屬效標)高低,假如兩者相關很高,則「同時效度」高。 預測效度:一個指標能預測在邏輯上與構念相關的事件。此指標與預測的事件是指向同一構念,但又有區別。 Note: 所謂「效標」是用來顯示測量工具所欲測量(或預測)的特質之獨立量數,以作為檢定效度的參考標準。
建構效度 指「量表能測量理論上某概念或特質的程度」,即構念是否能真實反應實際狀況。 建構效度有二類:收歛(convergent)效度及區別(discriminant)效度 *
收歛(convergent)效度 收歛效度 : 是指來自相同構念的這些項目,彼此之間相關要高。如,若要衡量相同的東西(筆試、口試),則所得分數(結果)應相同(筆試與口試成績之相關要高) 區別效度:此種效度也稱之為分歧效度(divergent validity),與收歛效度相反。此類效度是指當一個構念的多重指標相聚合或呼應時,則這個構念的多重指標也應與其相對立之構念 。 關聯性分析驗證、因素分析法
效度之檢定順序 首先評估有那些項目可作為測量工具之理論基礎(內容效度) 定義內容母體的項目,再從中抽取具有代表性樣本(建構效度) 觀察資料回收後,評估測量工具與外在效標(標準測驗)之相關,以衡量該測量工具的經驗(預測)效度。)
影響效度的因素 樣本性質:樣本多樣性、代表性愈高,測量工具效度就愈高。 測驗信度:若信度太低,則效度亦低 干擾(moderator)變數:它是指存在於測驗所欲測特質及其效標之外,但卻與兩者間具有某種相關程度的變數。例如,年齡層、性別、環境背景…等。
信度 信度(reliability)是指一個測量工具包含「變數誤差」的程度。 即在任何一次測量中,觀察值之間呈現之不一致、或是採用相同測量工具,然而對特定單位施測,每次所得結果都不一樣。 信度是指測量資料的可靠性,即一個測量工具在測量某持久性心理特質(態度)的「一致性」或「穩定性」
信度種類 等值性:又稱「複本法」,專門為檢定同一測驗中不同複本上分數的一致。 複本信度:不同研究者運用同一量表,對不同一批的樣本施測,結果的一致性。 穩定性:對同一批樣本,前後二期測兩次,若兩者的相關愈高,則表示該測驗的穩定係數愈高。 一致性:旨在檢定某量表在各種不同層面的一致性。例如,量表單獨項目與總分是否一致性…等等。此種信度又可分成:折半信度、庫李信度、Cronbach’s α信度…等幾類 the items are measuring the same underlying construct
信度的比較
信度的比較
信度 在實際應用上,Cronbach’s α值至少要大於0.5,最好能α>0.7(Nunnally, 1978) 在行銷界有名的學術期刊論文中,有85%論文之量表α值大於0.5,有69%量表α值大於0.7 items 間的 cov 愈大Cronbach’s α值愈大
信度與效度關係 「效度信度」(若p則q關係式) 有效度一定有信度 但有信度不一定有效度 無信度一定無效度 信度過低,則沒有效度 效度過低,則信度沒有意義。
信度與效度的處理 最好的方法是使用學理上驗證過的工具。例如,在MIS調查研究中,可以採用Ives, Olson 及Baroudi(1983)或Bailey及Pearson(1983)之使用者滿意度(user satisfaction)測量 自己根據定義創造出來的衡量尺度、或整合、修改以前的工具,則必須有非常嚴謹的設計過程。前測與試測、信度與效度的檢定等工作可增加衡量尺度的說服力