測量 measurement
6.1測量的定義 「測量」是針對某一特定對象、人、或組織,有關某種特徵或行為(消費、所得、人格特質…),賦予其一個值,使其數值能代表(或符合)構念中所代表的概念或狀況。它是屬於衡量的問題。 「測量」就是研究者根據一定「規則」將數值(或其它符號)指派給物體或事物(變數)身上之一種程序。 *
測量的三個程序 (1)選擇可觀察的「個體或事物」(即「對象」 (2)以數字或符號代表事件的特性,即數值系統(numerical system) (3)依據指派「規則」賦予觀察值一個符號或數字,此種「規則」就是操作型定義。 *
數值系統可分四大類 1.名目(nominal)資料:此種變數可做「分類」。沒有大小沒有距離。例如性別 2.順序(ordinal)資料:此種變數可比大小及前後,但前後距離不等。只有大小沒有距離。例如5>4,但5-4≠1。例如,研究者常用Likert五點計分量表所得數據,可能是1~5分,亦可能是-2~+2分,這種資料屬於順序變數。 *
數值系統可分四大類 3.區間(interval)資料:具有前兩者的資料特性,且可以比較差距。前後距離相等,但沒有倍數關係,所以沒有絕對的0(有距離,但沒有絕對的零點)。例如5-4=1, 但4≠2×2。 比例(ratio)資料:具有前三者的資料特性,且可以做倍數比較。有距離,有絕對的零點。例如,4=2×2。 *
6.1.2 變數(variable)種類 1.自變數:在實驗法中又稱「因」(cause)變數或實驗變數,它是經由實驗者安排或操弄的變數。 2.依變數:在實驗法中又稱「果」(effect)變數或反應變數,它是實驗者企圖觀察測量的行為或反應。 3.外生(extraneous)變數:指自變數以外,凡是可能影響結果 (依變數)之因素。
6.1.2 變數(variable)種類 4中介(intervening)變數:指介於自變數與依變數之間,凡是會對研究結果會產生作用的內在歷程。通常,它是不能直接觀察辨認的,只能憑個體外顯行為的線索來推知。 *
6.2 數值指派的「規則」
6.2 數值指派的「規則」
測量誤差 指「真正差異」以外任何引起測量分數的差異。測量誤差(誤差分數)的來源有二大類: (1)系統性誤差:它會對測量結果產生一致性固定的影響; (2)隨機性誤差:主要是來自受訪者身心狀況(情緒、性格、動機…)、情境因素(噪音、太太在場、趕飛機、太熱…)、及測量試題(內容太長、太難…)的干擾影響 *
(1)系統性誤差 系統性誤差(systematic errors)只要使用測量工具,它就會產生。系統性誤差對個案間及研究間的影響方式都是「固定」不變的。換言之,對相同情境受訪者或不同情境受訪者的同一位受訪者,均產生同樣的影響。 *
(2)隨機性誤差 每一次以「不同」方式來影響測量工具的使用。隨機性誤差(又稱非系統性誤差)之主要來源,可分成下列六種因素,這些因素是施測者無法控制的: *
隨機性誤差之主要來源 (1)受測者誤差:因受測者本身特質(如隨和性)不同、當時個人的情緒好壞,都會導致測量結果的不同。例如: 老大「愛問」「蕃茄為何有紅有綠?鵝為什麼叫聲大?岳母為什麼眼睛紅?」 老二「愛答」:「蕃茄因為曬到太陽、鵝因為脖子長、岳母沒睡好」。 老三「愛質疑」:「胡蘿蔔也會曬到變紅、青蛙脖子短但叫聲也很大、母豬每天睡眼睛也會紅」。 *
隨機性誤差之主要來源 (2)情境因素:訪談時任何外力的影響 (3)施測者誤差:有許多種,例如,訪談者的解釋、重述、語氣、態度和藹可親、肢體動作、草率的資料處理…等等。 (4)量表的使用方式:是由訪問員代填,還是受訪者親自填答。 (5)資料的分析處理之影響。 *
隨機性誤差之主要來源 (6)測量工具誤差:量表的設計及形式,包括: (I)測量工具內容:混淆(區別效度不佳)、語意不清(信度不佳)、編排不良(建構效度不佳)…等; (II)測量項目不足,未能涵蓋所欲測量的特性(即內容效度不佳)、項目的篩選 (III)有沒有引導作答的嫌疑…等等。 *
測量工具好壞的評量準則 1效度:該量表是否真能測量到我們欲衡量的特性(系統誤差小)。 2信度:該測量工具所衡量的結果是否具有穩定性、一致性(隨機誤差小)。 3敏感度:事物起了變化,該測量工具是否能顯現出差異。 4實用性:即考量該測量工具的經濟性、便利性、可解釋性。 *
6.4 量表(scale)的設計 所謂「量表化」(scaling),它是一種測量的程序,旨在將衡量對象或欲衡量的特性(property)指派某些數值,以便將測量對象之特性數值化。 衡量「變數」可用單一問項來量 衡量「構念」則要用量表來量。量表是用一個以上的指標(indicant ,item, manifested)來測量某個體/事物的特性。 *
6.5 「量表」設計的技術 (I)李克特量表,採用「評分加總」之計分方式 (II)Thurstone量表,又稱共識量表 (IV)Guttman量表,採用累計量表計分方式。 *
李克特量表 李克特(Likert)量表是屬「評分加總式量表最常用的一種,屬同一「構念」的「這些項目」是用「加總」方式來計分,單獨或個別項目是無意義的。 「評分加總式量表」是對某一概念/構念所設計的數個項目,測量每位受訪者對它們的態度反應(同意程度)。每一個反應都給一個數值,以代表受訪者對該項目的贊同程度,將每位受訪者在這些項目的得分加總,即是受訪者對該題的態度。 *
李克特量表 加總式量表有二個假說或特徵: (1)每一個態度項目都具有相同量值,但項目之間則沒有差別量值。 (2)對同一項目而言,受訪者的反應程度是不同的(具有差別量值)。 *
Likert量表設計的步驟 1建立大量有關某一「態度」構念之題庫,每一個敘述(statement)等於一個項目(item),並隨機式排列這些項目。 2邀請一組樣本,請各受訪者對上述態度各項目表達立場(pretest,pilot study) 3進行項目分析:旨在對量表之題庫做篩選,它是假定每一項目都具有相同的量值。項目的好壞是依據其是否具有區別力判定,被判定為較差別力 之項目,則刪除它。 *
項目分析之方法 1相關分析法:計算每一項目與總分的積差相關(以符號Rti表示),當作該題的「區別指數,區別指數偏低者,即表示該題未能區分受試者的反應程度,沒有區別效果,可予剔除。 2內部一致性效標分析法:將所有受試者在預試量表得分的總和依高低分排序,然後由最高分者起算總人數的25%為高分組,由最低分者起算,總人數的25%為低分組。爾後以高分組受試者在某一項目(題)得分之平均數減低分組受試者在同一題得分之平均數,其差即代表此題的鑑別力。(p136)
Thurstone 量表 是由一群「專家」篩選項目準則來刪題 (1)與研究主題有關聯性 (2)題意是否模糊(即專家對該題去留意見不一致者) 不一致者的項目刪除
語意差異量表 語意差異是假設事物的意含可能有多種層面,而這些特質層面之空間,謂之語意空間,例如: 好的 1 2 3 4 5 6 7 差的 好的 1 2 3 4 5 6 7 差的 快的 1 2 3 4 5 6 7 慢的 強的 1 2 3 4 5 6 7 弱的
語意差異量表之設計步驟 1.先建立題庫(一組項目),並對「態度」目標物,就受訪者可能的反應,選擇其兩極化的形容詞,來橫跨「1至7」之選答區,以便受訪者填答 2.對受訪者所回收資料進行資料分析,計算出每題(變數)的平均數。 3.依據項目順序,將每題(變數)平均數集結起來,以形成整個量表之特徵輪廓(p142) *
Guttman量表 Guttman量表則可用來檢定具有不同強弱程度之一組項目是否都屬「單一構面」(uni-dimension),所謂「單一構面」是指受訪者對項目所反應的態度,均集中在某一方向上。 例如,組織階層、社會差距、種族歧視、自主性(反權威、反傳統、開放性)…等等。 *
Guttman量表
Guttman量表編製步驟 1.首先建立可以用來測量某事實之具體句子或項目。 2.選取一組樣本進行前測(pre-test),將那些被80%受訪者填答「同意」或「不同意」的項目刪除。 3.後測時,約找100人以上受訪者對上述3至6題勾選意見。 4.整理後測回收資料,將彙總後的數據代入CR公式,以求出「複製係數,若CR值在0.8以上者,才可以說:「這些強烈程度 題確實屬於同一構面」。
6.6 效度 信度過低,則沒有效度 效度過低,則信度沒有意義。 三種效度:內容效度、效標關聯效度、及建構效度。 *
6.6.1 內容效度 1.抽樣(sampling)效度:量表所包含的項目是否能代表母體構念的項目。內容效度的高低,端賴項目(item)取樣代表性之大小而定。 2.表面(face)效度:是指量表項目和形式上,給人的主觀印象,如果該量表從外表來看,似乎確實可適切地測量其欲測的特質或行為,便稱它具 有表面效度。 *
6.6.2 效標關聯效度 又稱實用效度或實証效度,意指這種效度應建立在實証資料之上。效標關聯效度並不涉及構念的問題。依據效標不同,效標關聯效度可分為同時效標及預測效標,兩者皆表示測量工具(分數)和效標之間相關的程度。 效標關聯效度可分為同時(concurrent)效標及預測(predictive)效標 *
6.6.2 效標關聯效度 1.同時效標:是指測量工具與效標同時出現。例如,以「口袋中零用錢」(屬測量工具)衡量受訪者的「所得」(屬效標)高低,假如兩者相關很高,則「同時效度」高。 所謂「效標」是用來顯示測量工具所欲測量(或預測)的特質之獨立量數,以作為檢定效度的參考標準。 *
6.6.2 效標關聯效度 2.預測效標:是指測量工具出現在校標之前。例如,研究者自編「成就測驗」(量表)及可用預測兩年後研究生英文成績當效標,假如兩者相關很高,則表示該量表「預測效標」高。
6.6.3 建構效度 指「量表能測量理論上某概念或特質的程度」,強調的是量表所衡量的是否能代表所要衡量的構念。 建構效度有二類:收歛(convergent)效度及區別(discriminant)效度
收歛(convergent)效度 收歛效度是指來自相同構念的這些項目,彼此之間相關要高。如若要衡量相同的東西(筆試、口試),則所得分數(結果)應相同(筆試與口試成績之相關要高) 收歛效度及區別效度常用的「統計檢定」有三種方法:(1)相關分析、(2)因素分析」求量表各項目之因素結構矩陣,再由結構矩陣所表列之因素負荷量大小來判定建構效度好壞。(3) 「多特質多方法」 來檢定) *
效度之檢定順序 1)首先評估有那些項目可作為測量工具之理論基礎(內容效度) 2)定義內容效度的項目,再從中抽取具有代表性樣本(建構效度) 3)觀察資料回收後,評估測量工具與外在效標(標準測驗)之相關,以衡量該測量工具的經驗(預測)效度。 *
6.6.6 影響效度的因素 1)樣本性質:樣本多樣性、代表性愈高,測量工具效度就愈高。 2)測驗信度:若信度太低,則效度亦低 3)干擾(moderator)變數:它是指存在於測驗所欲測特質及其效標之外,但卻與兩者間具有某種相關程度的變數。例如,年齡層、性別、環境背景…等。 *
6. 信度 信度(reliability)是指一個測量工具包含「變數誤差」的程度。 6. 信度 信度(reliability)是指一個測量工具包含「變數誤差」的程度。 即在任一次測量中,觀察值之間呈現之不一致、或採用相同測量工具,然而對特定單位施測,每次所得結果都不同。 信度是指測量資料的可靠性,即一個測量工具在測量某持久性心理特質(態度)的「一致性」或「穩定性」 *
6.7.1 信度種類 1.等值性信度:又稱「複本法」,專門為檢定同一測驗中不同複本上分數的一致。 6.7.1 信度種類 1.等值性信度:又稱「複本法」,專門為檢定同一測驗中不同複本上分數的一致。 (1)複本信度:不同研究者運用同一量表,對不同一批的樣本施測,結果的一致性。 (2)折半係數:將同一量表「項目內容相似」,分成兩半(單數題、雙數題),計算各半測驗的總分之相關。 *
6.7.1 信度種類 2.穩定性信度:對同一批樣本,前後二期測兩次,若兩者的相關愈高,則表示該測驗的穩定係數愈高。 6.7.1 信度種類 2.穩定性信度:對同一批樣本,前後二期測兩次,若兩者的相關愈高,則表示該測驗的穩定係數愈高。 3.一致性信度:旨在檢定某量表在各種不同層面的一致性。例如,量表單獨項目與總分是否一致性…等等。此種信度又可分成:折半信度、庫李信度、Cronbach’s α信度…等幾類 *
信度的比較
6.7.3 信度與效度關係 「效度信度」(若p則q關係式)。 有效度一定有信度 但有信度不一有效度 無信度一定無效度。 *
6.7.4 量測工具信度與效度的處理 1.最好的方法是使用學理上驗證過的工具。例如,在MIS調查研究中,可以採用Ives, Olson 及Baroudi(1983)或Bailey及Pearson(1983)之使用者滿意度測量 2.自己根據定義創造出來的衡量尺度、或整合、修改以前的工具,則必須有非常嚴謹的設計過程。前測與試測、信度與效度的檢定等工作可增加 衡量尺度的說服力。 *
The End