Basic Concepts for Quantitative Research 第一章 量化研究的基本概念 Basic Concepts for Quantitative Research
課程目標 了解何謂科學,何謂科學研究 了解科學研究的特性與程序 了解不同的量化研究方法 比較不同的量化研究方法 了解量化研究的基本結構與內容 了解電腦科技對於量化研究的影響
科學方法 簡單而言,科學方法就是以有系統且可驗證的方式,來探討我們生活當中習以為常的經驗法則。 2009©高明峰 /
科學與科學活動 科學:解謎的活動 (Kuhn) 科學活動:採用一套特殊的方法與程序來探討未知的事物。 量化研究(quantitative research):科學研究中常態典範。 方法論與研究方法 方法論:涉及科學活動的基本假設、邏輯及原則的討論,目的在探討科學研究活動的基本特徵。 研究方法:指從事研究工作所實際採用的程序或步驟。不同的學門基於不同的研究問題,研究方法自有差異,
科學研究的特性 定義: 科學的目的 科學的特性 科學:是一種態度(attitude)與方法(method),以進行有系統的觀察與控制、精確的定義測量與分析、完成可重複檢證的發現。 科學研究:採取有系統的實證研究方法所進行的研究。 科學的目的 對於現象的描述、解釋、預測與控制,最終在改善人類的生活品質。 學術的立場偏重於描述、解釋與預測;實務的立場則著重於控制 科學的特性 系統性、客觀性、實證性
科學研究的主要內容 p1-7 變項─表現被研究對象的某一屬性因時地人物不同而在質(quality)或量(quantity)上的變化 操作型定義:界定一個概念或變項時,舉出測量該變項或產生該事象所作的操作活動,而非描述變項或現象的性質或特徵者 假設─變項之間的假設性關係p1-8 假說─經過證實的假設 定律─經過重複驗證的假說 理論─有組織、有架構、具有邏輯關係的假說或定律p-10
主要的量化研究設計p1-12
量化研究的內容p1-20 結果 討論與結論 緒論 方法 統計分析及圖表 摘述研究設計與發現 詮釋主要的發現與立場澄清 評論研究價值與意義 研究問題的介紹與說明 研究背景的整理與說明 研究目的與實務的陳述 方法 參與者或樣本 研究工具與器材 研究程序 分析方法 結果 統計分析及圖表 討論與結論 摘述研究設計與發現 詮釋主要的發現與立場澄清 評論研究價值與意義 指出缺失與發展方向
電腦對於量化研究的影響 電腦的基本特性 正面的意義 負面的影響 速度、容量、普遍性、可塑性、服從性 樣本人數擴大,抽樣誤差降低,增加統計推論的正確性 促成多元變數統計方法的發展 採用運算公式替代定義公式,節省電腦作業時間 以原始資料直接進行處理 報導統計檢定犯錯誤的機率 教學模式的改變 負面的影響 過度依賴程式,逃避統計理論基礎與方法的理解,因此無法正確判斷統計方法的使用時機 報表的判讀的偏差與誤用 反果為因,重視分析輕乎創意 新增加了一些傳統方法不致發生的問題
統計決策流程圖 p-125 統計學分析的 (動態) 過程包含: 步驟1:問題的界定 (Problem Identification) 步驟2:資料的蒐集 (Data Collection) 步驟3:資料的整理 (Data Arrangement) 步驟4:資料的分析 (Data Analysis) 步驟5:資訊的解釋 (Information Explanation) 步驟6:決策的制定 (Decision Making)
統計學的重要性 統計學(statistics)是一門應用數量方法來收集、整理、分析和解釋資料,並由研究樣本的性質推論未知母群體性質,期待在不確定的情況下作決策的科學方法。
統計學的分類 1.描述(敘述)統計學(descriptive statistics) --依內容性質分 1.描述(敘述)統計學(descriptive statistics) 2.推論統計學(inferential statistics) 3.實驗設計(design of experiments)
描述(敘述)統計學 一套用以整理、描述、解釋資料的系統方法與統計技術。
推論統計學 以研究母群體性質為目的,從母群體抽出部份樣本為對象,再根據樣本得到的結果推論母群的特性,並且附帶陳述這種推論為正確的可能性和可能犯錯的機率。 樣本
以下情境使用何種統計? 1. 某國小測量86學年度全校新生之身高,並計算出該校新生平均身高。 2. 某研究者想瞭解「默讀」和「朗讀」對閱讀理解測驗成績的影響,他自某校隨機抽20名學生,然後將他們分派到兩組接受不同的閱讀策略指導,之後施以閱讀理解測驗,以瞭解學生的閱讀理解測驗成績是否因閱讀策略不同而有所差異。
以下情境使用何種統計? 3. 某國中從該校三年級學生中隨機抽出78人,計算出他們物理和化學科成績的積差相關係數,據此來試估計該校三年級學生物理和化學科成績的相關係數。 4. 某班導師調查全班學生戶籍所在地,並計算出該班學生來自各縣市之人數的百分比。
1-2 統計資料的類型 本節說明統計資料的類型 (尺度類型),此節的內容相當重要。因為不同的資料類型有不同的統計分析方法 (或說有對應更合適的統計分析方法)。由於一般初等統計學以數值類型的資料為主要處理對象,因此常讓學生誤以為可以將這些方法應用在所有的資料類型上,進而導致錯誤的決策發生。
統計資料分類 資料尺度方式分類法 【Stevens (1946)】 資料蒐集方式分類法 資料時間構面分類法 Q:統計資料分類的重要性為何? A:不同的資料類型有不同的統計分析方法 (或說有相對合宜的統計分析方法)。因此,唯有了了解資料的本質,才能選擇最合適的統計學方法進行分析,進而做成較正確的決策。
資料尺度分類法 Stevens (1946) Level 1:名目或類別尺度 (Nominal or Categorical Scale) Level 2:順序或等級尺度 (Ordinal or Rank Scale) Level 3:區間或等距尺度 (Interval Scale) Level 4:比率尺度 (Ratio Scale) Leve 1 & 2:由於沒有明確距離 (Distance) 的概念,因此有人統稱為質性尺度 (Qualitative Scale)。 Level 3 & 4:由於有明確距離的概念,因此有人統稱為量化尺度 (Quantitative or Metric Scale)。
Level 1:名義或類別尺度 名目變數的狀態可能以數值方式表示,如:女生以0表示、男生以1表示。所賦予的數值,僅用於辨識或分類,該數值並沒有特別的數理意涵,因此無法進行任何數學運算。 範例1-6: 性別:男/女; 工作單位:行銷部/財務部/生產部。 居住地區:北部/中部/南部/東部。 專門處理此類資料的方法,稱為類別資料分析(Categorical Data Analysis) 【第15章】
Level 2:順序或等級尺度 除了名義尺度的功能外,所賦予的數值還可以比較出彼此之間的優劣、高低等順序性,但數值間並沒有特別的距離概念。因此,僅可以做<, =, >等邏輯運算。 專門處理此類資料的方法,稱為排序統計學 (Order Statistics)。【第15章】 範例1-7: 成績的名次:第1名的成績100分,第2名的成績70分,第3名的成績是65分。很明顯的第1與2名間的成績差異及第2與3名間的成績差異並不相等,因此,此類尺度的數值僅能夠進行大於、等於與小於等比較運算,無法做進一步的代數運算。 芮氏地震規模 (Richter Magnitude Scale) 值得一提的是行銷調查中常見的回答選項:非常不滿意、不滿意、普通、滿意與非常滿意等選項,如果嚴謹的劃分,則其應歸屬於順序尺度而非區間尺度。【時至今日,此仍是個有爭議的議題】
Level 3:區間或等距尺度 除了名目尺度與順序尺度的功能外,所賦予的數值還可以計算出彼此間距離差異的大小。這類尺度的資料,可以進行<, =, >, +, - 等邏輯與數學運算。 範例1-8: 成績:0~100分。 攝氏溫度 (Celsius Temperature Scale)。
Level 4:比率尺度 除了名目、順序與區間尺度的功能外,由於比率尺度具有自然原點(Natural Zero),故可進一步計算出彼此數值間差距的倍數。這類尺度的資料,可以進行<, =, >, +, -, ×, ÷ 等數學運算。 範例1-9:身高、體重、銷售量等資料。我們可以說N牌手機今年的銷售量比去年成長了1.5倍,因為銷售量有自然原點。
表1-1 衡量尺度彙整對照表
關於資料類型的注意事項 不同的尺度資料類型,通常對應不同的資料整理與統計分析方法 (不同的資料類型,有相對較適合的分析方法)。 高等級尺度的資料類型可以轉換為低等級尺度的資料類型;反之,低等級尺度的類型不能轉換為高尺度的資料類型。例如:銷售量【比率尺度】可以透過設立門檻值,將原始數據轉換成高銷售量/低銷售量兩種等級的數據【順序尺度】。但是一般而言,除非轉換有利於問題的分析或決策制定,否則不建議進行轉換,因為高等級尺度的資料類型富含的資訊量較多,無意義的轉換將使得資訊無端喪失!
圖1-2 衡量尺度別與對應的統計方法 量化與質性與否,以有無明確距離概念劃分。若有則歸類為量化;若無則歸類為質性。 質性資料必然為離散型,但量化資料可能為離散 (可與整數系對應謂之) 或連續型 (任兩數間可再穿插一數謂之)。 不同尺度資料有不同對應的統計分析方法。高階尺度可以透過轉換降階為低階尺度,但除非有必要性,否則不建議為之。
資料蒐集方式分類法 調查資料(Survey Data) 觀測資料(Observational Data) 實驗資料(Experimental Data)
圖1-3 蒐集方式別與對應的統計方法
圖1-5 統計分析概念圖 謝明華 2008© 謝明華統計園地 http://mhsieh.gotdns.org/stat/
幾個重要的統計專有名詞 母群(Population): 根據研究者所想要探討的全部個體所形成的集合,一般以N來表示母體的規模或大小(Size)。又分為有限母體(Finite Population)或無限母體(Infinite Population)兩類。 母群參數或母數(Parameter): 指描述母體特性的特徵值,此特徵值為確實存在的常數值,但實際上,除非對母體的所有個體均進行調查(普查),否則難以精確知道。我們有興趣的並非母體,而是對應研究目的之下,母體的某些特徵量。 以選舉為例,我們有興趣的並不是台灣2,300萬人中具有投票權的公民(母體),而是所有公民對於候選人支持的比例(母體參數),此外,我們也不會對所有公民購買某些知名電子品牌的偏好程度有興趣(雖然這也是代表對母體某特徵的參數感興趣,但卻不是這個研究欲探討的課題)。
幾個重要的統計專有名詞 (續) 樣本(Sample): 樣本統計量(Statistic): 樣本是指母體中的部分個體所形成的小群體,亦即母體的部分集合,一般以n來表示樣本的規模或大小 。 樣本統計量(Statistic): 樣本統計量是描述樣本特性的特徵變量,其為樣本的函數,所以稱為變量,因為統計量的數值會隨不同的抽樣樣本而變動。一般以大寫英文字母註記(抽樣前)樣本統計量,如 ,而以小寫英文字母註記(抽樣後)所計算的樣本的統計值(Statistics),如 。有時為列式的方便性,並不特別區別兩者),但讀者請自行留意大小寫的區別。 注意:請留意樣本大小 (Size) 與樣本數目 (Number) 兩名詞上的差異。
表1-2 常見母體參數與統計量之符號對照表
幾個重要的統計專有名詞 (續) 普查方式(Census Approach): 抽樣方式(Sampling Approach): 研究者針對感興趣的母體特徵,對母體中所有的個體進行該特徵的調查或測量,其後再將所有個體的資料彙整為母體特徵量(母數),這就是普查。 抽樣方式(Sampling Approach): 自母體中以某種抽樣方法(Sampling Methods),抽取出具有代表性的部分個體(即樣本)之方法即為抽樣。 研究者真正有興趣的是與研究問題有關的母體參數值,該值可以透過普查或抽樣兩種方式獲得。然而,普查一般僅適用在N不大的母體下。若N很大,基於成本效益的考量,研究者通常更傾向採用抽樣的方式,自母體中抽出n個具代表性樣本(通常n遠小於N),經由表徵樣本特徵的樣本統計量來推論母體參數。
範例1-18與圖1-5的串聯 本例將圖1-5的觀念對照2008年總統大選的例子來做說明(如圖1-6),在此例中我們有興趣的是謝蘇與馬蕭兩組候選人的支持率(特定的母體參數),由於投票當日台灣具有公民投票權的人數(母體)共有17,313,854人(即為N),若對整個母體進行普查,顯然所需耗用的時間與經費不符合成本效益,因此只能透過抽樣調查的方式(第2章與第9章),在預先設定允許的誤差水準內(第10章),自母體中抽取具代表性的樣本(總數為n,而n遠小於N),藉由樣本的支持率來推論母體的支持率(第10章)。
圖1-6 對照實例之統計分析概念圖
本節主要說明統計學領域的常見分類方式,以利同學對於統計學範疇有概要性的瞭解。 1-4 統計學領域的分類 本節主要說明統計學領域的常見分類方式,以利同學對於統計學範疇有概要性的瞭解。 謝明華 2008© 謝明華統計園地 http://mhsieh.gotdns.org/stat/
統計學領域的分類 依據探討的範圍是否進一步延伸解釋進行分類 依據理論或應用性進行分類 依據資料母體分配知悉與否進行分類 敘述統計(Descriptive Statistics) 推論統計(Inferential Statistics) 依據理論或應用性進行分類 數理統計(Mathematical Statistics) 應用統計(Applied Statistics) 依據資料母體分配知悉與否進行分類 有母數統計方法(Parametric Statistics) 無母數統計方法(Nonparametric Statistics) 謝明華 2008© 謝明華統計園地 http://mhsieh.gotdns.org/stat/