國立中正大學勞工研究所 黃良志 副教授 中 華 民 國 九 十 四 年 九 月 研究資料蒐集與準備 國立中正大學勞工研究所 黃良志 副教授 中 華 民 國 九 十 四 年 九 月
研 究 步 驟 選 定 研 究 問 題 閱 覽 有 關 研 究 文 獻 界 定 研 究 問 題 建 立 研 究 假 設 擬 定 研 究 設 計 從 事 資 料 收 集 從 事 資 料 分 析 撰 寫 研 究 報 告
資料蒐集的方法 文獻探討 調查方法 ( 問卷調查、面對面調查、電話訪談 ) 觀察法 個案法 實驗法 其他相關之研究方法
文獻資料的來源 相關學科的研究報告、定期刊物、學位論文等。 相關學科的書本所論著之學說與理論等。 一般論著、 民間通俗典故、具創造性或思考性文章。 單位內部之關文件。 政府相關文件資料或出版刊物。 廣告媒體或商業資源。
測量量尺的種類 測量量尺( measurement scale ) 是一種分派數字於人、事件或物體之上的法則。 1.名義 ( 類別 )量尺( Nominal scale ) : 依據其特質的同等性而將其分類,分派數字給每一類別,使其較易於指認,如性別、球衣號碼、公路編號,並可計算與比較每類間的次數分配。
測量量尺的種類 2. 次序量尺 ( Ordinal scale ): 可指出類別的不同,亦可說明高低或大小 的順序。如學生的成就程度,第一、二、三名 ,但無法比較第一比第二好多少! 3. 等距量尺 ( Interval scale ): 具有說明差異數量大小的重要特性,無真正零點 ( True zero ),但因為單位相同,所以可比較差異,如80-70=70-60。
測量量尺的種類 4. 比率量尺 Ratio scale : 不但具有上述三項之特性,且具有真正的零點 絕對零點 ,如身高、體重或學生人數。
測量量尺的統計應用 1. 名義量尺: 做次數統計 ( frequency statistics ),如χ2 、百分比 ( Percentage )、列聯相關係數 ( Contingency Coefficient )。 2. 次序量尺: 表現出大小順序,適合以中位數、百分位 數、第等順序相關係數 ( ρ ) 、肯式 ω ( Kendall’s ω ) 來分析。
測量量尺的統計應用 3.等距量尺: 須將資料轉換成常態分配與標準差相等之假設;適用之統計方法有平均數、標準差、積差相關、 t 和 F 檢驗等。 4. 等比量尺: 具有絕對零點,除前述各種統計方法可適用外,尚可採用幾何平均數 ( Geometric mean ) 和變化係數 ( Coefficient of variation ) 。
測量量尺的比較一覽表 量尺的水準 正式特徵 功能 例子 類別 (名義) 次序 (等級) 等距 等比 相互排斥 且可辨識的類別 能分類和描述 相互排斥 且可辨識的類別 能分類和描述 種族:1 , 2 , 3 代表:1:白;2 ;黑; 3 :黃種人 次序 (等級) 等第順序: >或< 上述功能加 上 等級 測驗分數,7比6要大些,但是單位代表不同的數量 等距 量尺上的單 位具有相等 的意義 上差異的決 定和比較 溫度、海拔高度(可否說40ºC是20ºC的2倍熱?) 等比 有意義的絕對或真正零點 前述所有功 能加上比值的決定和比較 人的身高、體重,如3’是6’的1/280kg是40kg的2倍
態度量表項目的選擇標準 1. 辨別功能 ( discriminating function ) : 2. 辨別尖銳性 ( Sharpness of discrimination ) : 3. 整體量表上的辨別 : 4. 項目的數目 :
態度量表的主要類型 1. 總加法 ( method of summated ratings ) : 亦稱 Likert 量表 2. 累積法 ( method of cummulative scale ) : 亦稱為 Guttman 量表 3. 等距法(method of equal-appearing intervals) : 又稱Thurstone量表 4. 語意分析技術 ( Semantic differential techniques ) : 由Osgood等人創用
抽樣的基本概念 壹、基本名詞解釋 一、母群體 ( Parent population ) 二、抽樣單位 ( Sampling unit )/樣本點 三、樣本 ( Sample) 四、抽樣/取樣 ( Sampling )
貳、抽樣的理由 一、受經費、時間、或人力之限制 二、母群體中之樣本點具有被破壞性,不容許每 人普遍加以觀察 三、抽樣可配合定性與機動性之行政措施 四、抽樣可對研究對象或樣本點進行更深入之瞭 解與分析 五、抽樣可使研究計畫更週詳,資料之蒐集與處 理較不產生誤差 六、從事協同研究工作之助理人員,加以嚴格訓 練,可提高統計的正確性
參、抽樣的步驟 一、清的界定研究的母群體 二、設法取得一份包括較完整正確之抽樣單 位的母群體名單,即抽樣底冊 三、根據較完備的底冊,選用適當的抽樣技 術,抽出具有代表性的樣本 四、抽取夠大的樣本,以便樣本的統計量足 以代表母群體的特徵值
肆、抽樣與統計誤差 一、研究計畫的誤差: 1. 研究母群的不確定,或統計表徵定義的不清晰 2. 局部統計量的代表母群體 3. 抽樣設計不符合原所導致的誤差 二、樣本誤差: 1. 樣本誤差與樣本大小的平方根成反比 2. 樣本大小達一定數量後,並不隨母群體之加大 而須比例的加大 三、非樣本誤差: 1. 調查誤差包含答覆性誤差與非答覆性誤差 2. 調查以外的工作誤差
伍、抽樣的種類 一、機率抽樣(Probability sampling)或隨機 抽樣(Random sampling) 1. 簡單隨機抽樣(Simple random sampling) 2. 分層隨機抽樣(Stratified random sampling) 3. 系統抽樣(Systematic sampling) 4. 叢集抽樣(Cluster sampling)
伍、抽樣的種類 二、非機率抽樣(Non-probability sampling) 或非隨機抽樣(Non-random sampling) 1. 立意抽樣(Purposive sampling) 2. 雙重抽樣(Double sampling) 3. 配額抽樣(Quota sampling) 4. 滾雪球抽樣(Snowball sampling)
陸、樣本的大小 一、若不考慮系統誤差,在機率的理論 上,樣本的大小決定在統計分析 時,即預定的檢定力及抽樣誤差大 小的兩個既定準則上 二、若無系統誤差,樣本愈大,抽樣誤 差愈小,亦即代表性愈高
(7)抽樣樣本數之決定: 成本與精確之考量 統計推論是允許有誤差的, 但重要的是要能控制誤差
陸、樣本的大小 三、但由於經費、人力、及時間的限制,只 能抽取有限的樣本從事研究;一般而言 ,相關研究的滿意樣本至少要有30名; 因果比較研究與實驗設計,至少每一組 要有15名;調查研究則至少每一組要有 100名 ( Sadman, 1976 ),而次要的組別 至少要有20至30名( Borg & Gall, 1979)
設計問卷內容應注意之原則 一、問卷的題目應合乎研究架構。 二、問卷題目的內容應清晰易懂。 三、問卷題目應避免涉及個人隱私權或社 禁忌問題。 四、問卷題目之難易度應與填答者的知能 接近。 五、問卷題目可分為事實問題與態度問題。 六、問卷題目的排例方式:
六、問卷題目的排例方式 1. 問卷題目涉及敏感或隱私問題時,應儘量放在後面 2. 同一類型的題目宜安排在一起。 3. 將一般性或容易回答的問題放在前面,而將特殊性或不易回答的問題放在後面。 4. 將會影響填答者看法的題目放在問卷後面,以免影響往後填答。 5. 問卷內容若涉及某些事件的時間,宜依序排列。 6. 有時為避免影響填答者的情緒,可將其個人基本資料放在問卷題目之後。
優良問卷的特徵 1. 問卷中的題目都是測量研究所要測量的 變項。 2. 問卷能顯現出和一個重要的主題有關,使填答者認為重要而願意花時間填答。 3. 問卷要儘可能簡短,其長度主要足以獲得重要的資料即可。 4. 問卷的指導語要清楚詳盡,重要詞句要加以界定,每個問題僅處理一個概念,而所有問題的用語,力求簡明清楚而易回答。
優良問卷的特徵 。 5. 問卷的題目要客觀,避免有導引所期望 反應的暗示。 5. 問卷的題目要客觀,避免有導引所期望 反應的暗示。 6. 問卷的題目要依心理的順序安排,由一般性而至特殊性之題目。如果可能的話,應避免引起令人困擾的私人或敏感性的問題。 7. 問卷所蒐集的資料要易於列表說明和解釋。 8. 問卷的外觀要能具有吸引力,不但要安排適宜,且要印刷精美。
優良問卷的特徵 9. 問卷中應包括下列重要資料: 研究目的、指導語、聯級人或單位、個 人基本資料、問卷題目。 10. 問卷可單獨或配合其他研究方法蒐集 資料。
撰寫問卷題目的原則 你以為大眾傳播工具會對兒童產生影響嗎? 一、題意要清楚明確,避免過於空乏。 二、容易誤解的字詞避免使用,否則就必 □ 是 □ 否 二、容易誤解的字詞避免使用,否則就必 須要清楚界定。 你那裡教書? 三、盡量使用肯定的敘述,避免採用雙重 否定。 你以為多數國中學生沒有不想升學的嗎? □ 是 □ 否
撰寫問卷題目的原則 你是否喜歡網球和排球? □ 是 □ 否 你的婚姻狀況? 四、避免題目中包含兩個問題的概念。 五、避免用學術上的專有名詞。 你是否喜歡網球和排球? □ 是 □ 否 五、避免用學術上的專有名詞。 你贊成大學聯考採用標準分數計算分數嗎? □ 贊成 □反對 六、避免使用不適當的選目(反應項目)。 你的婚姻狀況? □ 結婚 □ 未婚
撰寫問卷題目的原則 你以為青少年犯罪的原因是什麼? 七、題目必須在填答者能回憶的範圍之內。 八、題目必須避免引起填答者情緒困擾 的內容。 在幼兒時父母是否處罰過你? □ 是 □ 否 八、題目必須避免引起填答者情緒困擾 的內容。 你家中是否有人酗酒? □ 是 □ 否 你曾經在考試作弊嗎? □ 是 □ 否 九、避免需要花太多時間填寫的問題 你以為青少年犯罪的原因是什麼?
撰寫問卷題目的原則 十、避免有不適當假定的題目。 十一、避免具有導引反應的暗示性線索。 你是否滿意去年的加薪? □ 是 □ 否 □ 是 □ 否 十一、避免具有導引反應的暗示性線索。 醫生認為吸煙對身體有害,你的意見如何? □ 贊成 □ 不贊成 教育部體育司長主張聯考加考體育一科,您 的意見如何? □ 同意 □ 不同意
撰寫問卷題目的原則 十二、題目中如有特別重要或需要強調的觀 念, 應在這些字詞之下加線表示。 十三、當反應項目是屬於類別項目時,必須 教師不應該告知學生的IQ嗎? □ 是 □ 否 你贊成師範大學或師範學院單獨招生嗎? □ 是 □否 十三、當反應項目是屬於類別項目時,必須 列舉完整。 當有問題時,你通常先找誰談? □ 1. 父母 □ 2. 老師 □ 3. 同學 □ 4. 牧師 □ 5. 朋友 □ 6. 其他
撰寫問卷題目的原則 十四、題目避免過度冗長和複雜。複雜的題 目應分成幾個連貫性的問題。 十五、當反應項目是屬於類別項目時,反應 項目彼此之間必須相互排斥,沒有重 疊現象。 你比較贊成下列哪種類型的學校? □ 1. 男女合校 □ 2. 男女分校 □ 3. 男女合班 □ 4. 男女分班
撰寫問卷題目的原則 十六、如果題目是屬於評定或筆記的,必 須提供參考照點。 十七、題目應以能提供完整資料的問題為 宜。 這位實習教師的教學成績應評定為: □ 優等 □中等 □劣等 十七、題目應以能提供完整資料的問題為 宜。 你是否看電視? □ 是 □ 否
撰寫問卷題目的原則 十八、如果問卷所有題目的反應項目均屬於相 同的類型,則不必逐題列出,僅寫出一 次即可。 滿意 不滿意 無意見 滿意 不滿意 無意見 1. 你對學校的圖書設備感到如何? □ □ □ 2. 你對校長的領導方式感到如何? □ □ □ 3. 你對學校行政的配合感到如何? □ □ □ 4. 你對學校教學工作的負擔感到如何? □ □ □
資料準備與初步分析 根據研究目的或研究架構或研究假設,慎選資料分析方法。 篩選與過濾符合研究之資料,如是問卷調查,則需剔除填答不完整之無效問卷,再進行編碼 ( coding ) 。 一般統計分析方法大致如下: --差異:t-test,ANOVA,... --影響:Regression --相關:Pearson’s correlation, Canonical correlation, ...
統計是一種科學方法 統計是解釋現象、尋找要因、預測分析。 提供決策的科學方法。 將資料簡化成有用的訊息。 以一張圖或幾個統計量來表達。
統計讓數字說話
統計三大基本精神 “以小搏大”(抽樣、推論) “簡化訊息”( 估計) “亂中取勝”(模式預測)
統計課程幾個重要的觀念 平均數、標準差、相關係數 -- 三種最重要統計量。 -- 在統計推論中扮演極重要角色。 平均數:看集中程度,樣本是一種隨機變數,可以算出 ;母體是固定但未知,是一種參數,無法計算其μ。
標準差之應用例 (a)品管(b)打靶(c)評分--大或小比較好?(d)風險。 作業或考試上應儘量提供此種統計量。 避免學生計算的困擾。
中央極限定理 是統計的基本定理, 說明常態分配之重要性, 並說明隨機抽機樣本平均數有 這是抽樣分佈最基本的概念。
p值的介紹 決策的錯誤機率 強調查表與電腦報表之差別。
座標與面積之關係
顯著水準與p值的關係 (a)顯著水準表示我們能忍受的型I誤差(type I error)之最大值。 此最大值通常訂為0.05。 表示20次中決策中可能有1次錯誤。
顯著水準與p值的關係 (b)也許初學者會認為20次抽樣犯一次決策錯誤太高,心中有疑惑。 為何不訂為100次中只犯一次錯誤(即顯著水準改為0.01)甚至更低呢?原因是當顯著水準訂的愈小,則在同樣的實驗(即抽樣樣本數相同)下,犯型II錯誤的機率(即型II誤差)就會愈高。
統計報表會提供p值 一般決策者的決策是: --當p值小於顯著水準,就說虛無假設H0是顯著的,否則H0不顯著。 --如顯著水準訂為0.05,p值= 0.042,表示H0是顯著,同樣,若p值= 0.003,也是表示H0是顯著。 --雖然p值= 0.042與p值= 0.003,都表示H0是顯著,但其意義則不同。
統計報表會提供p值 當p值= 0.003時,犯型I錯誤的機率很小,大約3/1000;所以,您拒絕H0是理直氣壯的;
樣本數對p值或決策的影響 兩變數抽樣的樣本相關係數都是0.3, 第一組的樣本數為100,可得到H0是顯著的結論(此兩變數有相關)。
抽樣樣本數之決定 成本與精確之考量。 統計推論是允許有誤差的。 但重要的是要能控制誤差。 似乎樣本數愈大,對H0 愈不利,但樣本數到底要多大才算好? --因果關係:樣本數愈大, H0 被 reject 之機率愈大。 --適合度檢定:與上述結果相反。
抽樣誤差 估計值 = 參數 + 方法偏差 + 抽樣誤差 ↓ ↓ ↓ ↓ 樣本資料 母 體 不當抽樣方法 抽 樣 對 象 估計值 = 參數 + 方法偏差 + 抽樣誤差 ↓ ↓ ↓ ↓ 樣本資料 母 體 不當抽樣方法 抽 樣 對 象 所 推 估 真正值 所造成 不同所造成
資料分類與統計分析方法的關係: 變數依量測分成
分析方法 (a)離散對離散:卡方檢定(列聯表)。 (b)離散對連續:F檢定 (ANOVA)。 (c)連續對連續:相關分析、迴歸分析。 (d)連續對離散:區別分析、邏輯迴歸。 (e)離散、連續對連續:ANCOVA、啞變數。
統計檢定有兩類: (a)因果關係統計:p值愈小愈好(可以 reject H0) (b)適合度檢定:p值愈大愈好(可以 accept H0)
因果關係統計 檢定參數=0 F檢定、t檢定 p值小,顯著
適合度檢定 (i) 資料適合某種分配(如常態分配) (ii) 提出模式是否合適 卡方檢定,p值 大,不顯著。
相關與因果關係 兩變數間有相關並不一定有因果關係。 相關係數=0,不表示兩個變數間是沒有相關的 --例如:某人收集過去20年台灣地區每年 冰淇淋銷售量與每年犯罪人數,結果發 現兩者間的相關係數是0.5 。
相關與因果關係 (a)試問由此相關係數是否可下冰淇淋銷售量與犯罪人數有相關? (b)您認為冰淇淋銷售量與犯罪人數的相關是直接相關(即有因果關係)或間接相關(受第三者的影響)?
相關與因果關係 (i)如果您認為是直接相關,請問何者是因?何者是果? (ii)如果您認為是間接相關,請問您認為可能同時影響冰淇淋銷售量與犯罪人數的第三者因素是什麼?