第 3 章 資料分類與蒐集 1.進行研究過程中最重要的步驟 2.資料收集與實驗設計具有關連性
研究假設之種類 研究假設: 依據研究目的對研究結果的預測,可能是數學式子或文字敘述。 研究目的:是感興趣的題目或特定目的。如: 方向性假設: 研究結果具有明顯因果關係。 非方向性假設: 研究結果沒有明顯因果關係。 研究目的:是感興趣的題目或特定目的。如: 某一新藥可以增加免疫力 多喝水對排便有幫助 每天運動30分鐘可以瘦身 每天睡足8小時可以減少老化 吃8分飽可以活更久 (以上是有方向性的假設(目的)) 研究目的:是感興趣的題目或特定目的。如: 每人的早餐種類不一定相同 魚類睡眠習性不相同 (以上是無方向性的假設(目的))
實驗與非實驗研究 實驗研究: 對實驗樣本進行因子處理,觀測處理對實驗樣本的效果,用以瞭解二者因果關係的過程,得到固定結論的機率較高。 非實驗研究: 在最自然情況下,觀察樣本的各種現象,得到固定結論的機率較低。 實驗研究, 如: 受測者分成二組, 一組服用新藥,另一組服用 安慰劑. 以了解新藥之效用. 非實驗研究, 如: 觀察每天經過某一路段騎車人數之變化. 二者差別在於,對受測者有無進行實驗處理!
實驗研究法 依據低、中和高準確性將實驗研究法分成三種:前實驗設計、準實驗設計和真實驗設計。 前實驗設計和準實驗設計合稱非正式實驗設計,真實驗設計又稱正式實驗設計。 實驗研究法: 其目的是了解因果關係.
前實驗設計 前實驗設計: 用於先導研究,目的是試驗使用的實驗處理或測量工具、探索新問題或驗證探索性新假設。 前實驗設計, 如: 前實驗設計法有三種: 單組前測後測實驗設計、單組後測實驗設計和靜態組比較設計。 前實驗設計, 如: 對少量受測者(樣本)進行新藥試驗, 以了解藥量, 投藥頻率,以及最高劑量等. 缺點: 樣本少 不具隨機性 再現性質難掌握 抽樣誤差大
準實驗設計 準實驗設計或半實驗設計: 在樣本不可能隨機分組情況下使用。 準實驗設計法有二種:不相等處理組和控制組設計;相等時間樣本設計。 準實驗設計, 如: 對同一批學生同一科目,改變授課教師, 了解學生學習(進步)情況. 缺點: 樣本無法隨機分組 不具隨機性 再現性質難掌握 抽樣誤差大(難估計)
真實驗設計 臨床試驗:屬於嚴謹真實驗設計,樣本隨機分成二組,處理組(treatment group)和控制組(control group),稱為隨機比較實驗(randomized comparative experiment),屬於完全隨機實驗法(completely randomized experiment) 。 雙盲實驗(double-blind experiment):受測者和執行者皆不知道本次實驗是屬於處理組或控制組。
真實驗設計 真實驗設計, 如: 對同一批學生隨機分成二組, 一組採用傳統教學授課,另一組問題導向 學習授課, 比較二組學生學習(進步)情況. 優點: 樣本隨機分組 具隨機性 再現性質易掌握 抽樣誤差易估計 單盲實驗: 只有樣本不知道自己是屬於何組。 真實驗設計法有二種: 前測-後測隨機分派處理組和控制組設計;僅後測隨機分派處理組和控制組設計。
實驗效度 實驗效度(validity): 實驗設計或實施過程中產生的偏差程度,有內在效度與外在效度。 實驗研究法的效度由高到低依序為: 真實驗設計>準實驗設計>前實驗設計
實驗效度 內在效度(internal validity): 實驗過程中出現難以掌控的因素;是觀察到的改變,真正受實驗處理影響的程度。 影嚮內在效度因素, 如: 儀器校正、人員熟練度 受測者心理因素(經驗、心情、…) 影嚮外在效度因素, 如: 抽樣誤差 實驗環境差異(溫度、濕度、…) 內在效度(internal validity): 實驗過程中出現難以掌控的因素;是觀察到的改變,真正受實驗處理影響的程度。 外在效度(external validity): 實驗設計時忽略一些因素;得到的實驗結果,能夠推論母體母數的準確程度。
實驗效度 實驗室實驗(laboratory experiments): 由人為方式控制實驗環境,內在效度高於外在效度。 實地實驗(field experiments): 在真實環境下進行實驗,外在效度高於內在效度。
非實驗研究法 非實驗研究法: 在最自然不可能操控實驗處理情況下,經由系統性實證調查,探討變項間是否具有因果、關聯或時序關係。 五種非實驗研究法: 因果比較研究、田野研究、縱貫性研究、歷史性研究和相關性研究。
因果比較研究 因果比較研究(causal comparative research)又稱事後回溯研究(ex post facto research): 在不可能使用實驗法情況下,使用回溯過去方式,探索造成目前狀況的原因。 例如: 研究殺人犯之犯罪心理與動機 研究人類得癌症之因果關係 缺點: 難以確定(判斷)因困關係之強弱
田野研究 田野研究(field research)又稱人種誌研究(ethnographic research):用非隨機抽樣方法,對某團體進行徹底密集個案研究。 例如: 調查吸毒者之行為(個案研究) 火蟻分佈路徑調查 缺點: 研究與記錄時間長 量化不易(質性研究居多)
縱貫性研究 例如: 縱貫性研究(longitudinal research): 在幾個不同時間點,重複多次蒐集性質類似資料的研究。 調查濱海物種種類分佈(個案研究) 火蟻分佈路徑調查 缺點: 調查結果易受環境變化影嚮 研究與記錄時間長 母體結構易改變 縱貫性研究(longitudinal research): 在幾個不同時間點,重複多次蒐集性質類似資料的研究。
歷史性研究 歷史性研究: 有系統蒐集和分析與過去發生事件有關資料,用來探究事件間的因、果或趨勢關聯性。 。 例如: 某疾病之家族史(遺傳性疾病) 某物種之消長情形 缺點: 調查結果易受樣本不全影嚮 科學量化困難
相關性研究 相關性研究: 探討二個或多個變量之間是否具有相關性。量化指標:相關係數。 例如: 每天讀書時間與學期成績之關係 二不同物種數量消長情形 缺點: 因果關係不易分辨
非實驗研究的限制 非實驗研究限制: 1.對變項只能被動觀察,不能操控或處理 2.難以避免抽樣偏差 3.難以建立研究假設,常造成不適當或錯誤解釋的危險
資料的構造 資料:文字或數字,又稱數據(data)。 實驗設計之初,必須先定義收集那些資料。 變項(variable)、變量或變數:相同性質的資料。 類別(categories)或變數:變項的內容,文字或數字。 因子(factor)或因素:屬性相同的變項。 實驗設計之初,必須先定義收集那些資料。 例如:欲收集教育程度、家戶所得、健保費用 以上三種資料稱為三個變項(或變數) ,其中: 教育程度: 稱為因子, 因為可以細分高中、大學、碩博 家戶所得與健保費用:稱變量,可以用數字表示
資料的類型 資料類型:按來源、性質、量度尺度、數據形式或關係分類。 初級資料: 來源:初級和次級資料 例如: 受測者年齡、性別、身高、體重 初級資料、原始資料或直接資料 次級資料、現成資料、二手資料或間接資料:研究者引用他人整理分析結果的資料。 初級資料: 例如: 受測者年齡、性別、身高、體重 次級資料: 例如: 生物期刊上已發表之數據、 網頁上股票資料
按性質分類 性質:質性和量性資料。 質性資料、定性資料或文字資料:用文字表示的資料。 質性資料: 例如: 受測者性別、教育程度、職位、… 量性資料、定量資料或數值資料:用數字表示的資料。 質性資料: 例如: 受測者性別、教育程度、職位、… 量性資料: 例如: 受測者之心跳率、血壓、身高、…
質性與量性資料的關係 量化(quantity):將質性轉換成量性資料的過程。 量化: 量尺:將質性資料轉換成量性資料之過程。 例如: 將滿意度用, 1=非常不滿意, 2=不滿意, 3=普通, 4=滿意, 5=非常滿意 表示 質化: 例如: 將血壓超過130定為’高血壓’ 量化(quantity):將質性轉換成量性資料的過程。 量尺:將質性資料轉換成量性資料之過程。
按量度尺度分類 量度:使用工具或儀器從樣本取得變項資料。例如:體重計、溫度計、… 量度層次(level)或尺度(scale):量度之難易或簡繁的程度及量度單位。例如:公分、公尺、“要vs.不要”、… 量度尺度:類別(nominal)、序位(ordinal)、等距(interval)和等比(ratio)層次。 類別(nominal):性別、顏色、… 序位(ordinal):滿意度、排名次、… 等距(interval):氣力測驗、溫度、年齡、… 等比(ratio):體積、面積、心博率、密度、….
等比層次、等距層次 等比尺度(ratio scale): 有真正的零刻度當起點,可以算出樣本間的比例,屬於量性資料。
序位層次、類別層次 序位尺度(ordinal scale): 依據相對差異大小排出順序或等級的資料,屬於質性資料。 類別尺度(nominal scale): 依屬性(attribute)歸類的文字資料,屬於質性資料。
度量層次之關係 1. 由繁而簡依序為:等比、等距、序位、類別。 2. 由繁化簡易,由簡化繁難。
按數據分類 形態:整數和小數。 數據:連續和間斷變項 間斷變項:地震發生次數、土石流次數、… 連續變項:體積、面積、心博率、密度、…. 形態:整數和小數。 數據:連續和間斷變項 連續變項(continuous variable)或無限變項:量度值連續出現在某一段值域裡。 間斷變數或有限變項:點計的結果,二點計值間不再出現任何量度值。
按關係分類 關係:應變項和自變項。 反應變項與自變項:X 造成 Y, 反應變項:珊瑚白化 自變項:海水溫度 關係:應變項和自變項。 反應變項(response variable)、應變項(dependent variable)、效標變項(criterion variable)、果(effect)或後測(posttest):對應於實驗處理的結果或輸出。
自變項 解釋變項(explanatory variable)、自變項(independent variable)、預測變項(predictor variable)、實驗變項(experimental variable)、因(cause)或處理(treatment):實驗處理或輸入。
原始資料的蒐集方法 方法:觀察和訪問。 訪問法 觀察法(observation):正面觀察法、暗中觀察法、直接觀察法、間接觀察法、人為觀察法、儀器觀察法、自然觀察法、設計觀察法等等。
表格設計原則 1. 變項個數不可太多。 2. 明確填寫方式。 3. 內容具互斥且周延性。 4. 資料須能輸入電腦以供後續統計分析使用。
問卷設計 問卷(questionnaire):開放式(open ended)或非限制式、封閉式(close ended)或限制式、混合式。 問卷設計十一步驟: 1. 依據研究目的決定變項 2. 決定問卷類型 3. 決定問題型式 4. 決定問題內容
5. 決定問題用語 6. 決定問題順序 7. 決定版面佈置方式 8. 配合統計軟體預先編碼 9. 預試檢驗信度(reliability),例如Cronbach α係數法 10. 修訂後定稿 11. 使用和維護
資料的完整性與準確性 完整性: 周延性(inclusion)和互斥性(exclusion)。 正確度(accuracy): 重複抽樣後量度結果的一致性或偏差程度,指統計量和母數差,又稱信度(reliability)。 精度(precision): 相同樣本重複量度時,結果的差異程度,又稱效度(validity)。
資料的準確性 系統性誤差(systematic error): 一定規律或方向的偏差(bias)。 隨機性誤差(random errors): 重複量度增加或減少量不相同。 量度值(M)、真正值(Tr)、系統性誤差值(Se)和隨機性誤差值(Re)關係如下:
資料的準確性 系統性誤差值愈小,量度值愈可靠(reliable),信度(reliability)愈高。 隨機性誤差值愈小,量度值愈有效(valid),效度(validity)愈高。
總 結 1. 明確定義變項義意與個數,選用適當測度量尺。 2. 避免隨機性誤差和系統性誤差的出現。