CHAPTER 9 量化研究Ⅳ - 資料處理與分析 -.

Slides:



Advertisements
Similar presentations
1051 检验 Chi-Square Test 第七章 Content test of fourfold data test of paired fourfold data Fisher probabilities in fourfold data test of R×C table Multiple.
Advertisements

©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
單元九:單因子變異數分析.
資料整理與圖表編製 內容說明: 教師與學生互動練習,熟習資料整理 與圖表編製。.
資料整理與圖表編製 內容說明: 教師與學生互動練習,熟習資料整理與圖表編製。.
第六章 统计表与统计图 第一节 统计表 第二节 统计图 1.
實驗規劃--實驗因子設定, 效標選定與受測者選定
Ch12 資料分析.
第6章 資料處理 行銷研究:發展有效行銷策略之基石 任立中、陳靜怡著 前程文化 出版 授課教師:
樞紐分析與資料庫 蕭世斌 Nov 20, 2010.
商用統計學 Chapter 12 類別資料分析.
二、以圖表描述資料 2. Charts & Graphs.
參考書籍:林惠玲與陳正倉(2002),應用統計學(第二版)。台北:雙葉書廊有限公司。
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
行銷研究 單元二 行銷研究的程序.
應用統計學 授課大綱 – 暑期班 By: Dr. Tsung-Nan Tsai.
統計學 郭信霖 許淑卿.
數 據 分 析 林煜家 魏韶寬 陳思羽 邱振源.
17 類別資料的分析  學習目的.
医学统计学 主讲人:信息部 林雪君.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
迴歸分析 主講人:童超塵 實驗室網址 永久: 實驗室網址 永久: 目前:
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
Chap3 Descriptive statistics -numerical measures Minitab & Excel
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
第3章 資料的整理與表現- 統計表與統計圖.
一、緒論 1. Introduction.
第六章 平均數比較 6-1 平均數比較(各種 T Test 的應用) 6-2 Means 平均數分析 6-3 單一樣本 T 檢定
Using EXCEL for ANOVA.
2-3 基本數位邏輯處理※.
點狀圖 (Dot Plot).
REGRESSION FOR ORDINAL OUTCOMES 「順序尺度依變項」的迴歸模型
邏輯迴歸 Logistic Regression
Chapter 2 頻率分配.
第2章 資料的整理和表現.
數位化學習滿意度關鍵影響因素之研究 國立高雄師範大學 資訊教育研究所.
Discriminant Analysis
介紹SPSS SPSS 本為 Statistical Package for the Social Sciences 的簡寫,由於產品及功能不斷地擴充,目前改名成 Statistical Product and Service Solutions。
第二章 SPSS的使用 2.1 啟動SPSS系統 2.2 結束SPSS系統 2.3 資料分析之相關檔案 2.4 如何使用SPSS軟體.
第十一章 相關研究法.
表達及陳列統計資料 統計圖表 統計量數 次數分配表 直方圖 次數多邊圖 累加次數圖 條形圖 圓形比例圖 集中量數 變異量數或離散量數
敘述統計I:表格與圖形法 Part A ( ) 第 2 章 敘述統計I:表格與圖形法 Part A ( )
第十四章 單因子變異數分析 14.1 前言 14.2 單因子變異數分析理論 14.3 功能視窗 14.4 範例
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第十章 順序資料之假設檢定 10.1 順序資料檢定概論 10.2 符號檢定 10.3 符號秩檢定(成對樣本檢定)
本章學習目標 學習極座標繪圖與對數繪圖 學習雙y軸繪圖 學習向量場繪圖 學習統計繪圖 在Matlab的環境裡製作動畫
Definition of Trace Function
有關於股票報酬及匯率變化對台灣醫療產業市場收益的分析
信度分析 (11/7~11/13) 1.何謂『信度』 2.信度分析步驟.
Chapter 1 多變量統計方法介紹. Chapter 1 多變量統計方法介紹 變數資料之類型 以衡量尺度分類 以變數的角色分類 名目尺度(nominal scale ) 序列尺度(ordinal scale) 區間尺度(interval scale) 比率尺度(ratio scale) 以變數的角色分類.
第12章 資料整理與量化研究 範例分析(一).
兩變數間的關係: 名義和次序資料的表格描述
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
楊志強 博士 統計學 楊志強 博士
Review of Statistics.
Ogive plot example 說明者:吳東陽 2003/10/10.
MicroSim pspice.
Introduction to Basic Statistics
流程控制:Switch-Case 94學年度第一學期‧資訊教育 東海大學物理系.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
第二章 次數分配表與統計圖 第一節 次數分配表的製作 第二節 統計圖的製作 第三節 次數分配的形狀和性質 第四節 電腦習作.
第十四章名義資料的數字 描述:關連測量 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
第四章 統計資料的整理:統計量數.
使用VHDL設計-8x3編碼電路 通訊一甲 B 楊穎穆.
資料表示方法 資料儲存單位.
第一章 直角坐標系 1-3 函數及其圖形.
Chapter 1 多變量統計方法介紹. Chapter 1 多變量統計方法介紹 變數資料之類型 以衡量尺度分類 以變數的角色分類 名目尺度(nominal scale ) 序列尺度(ordinal scale) 區間尺度(interval scale) 比率尺度(ratio scale) 以變數的角色分類.
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
Statistical Table and Statistical Graph
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
Presentation transcript:

CHAPTER 9 量化研究Ⅳ - 資料處理與分析 -

本章架構圖 第一節 調查資料的接收和編輯 調查資料的編碼和輸入 調查資料的統計預處理 資料統計任務書的制製 資料處理 第四節 獨立樣本之T檢定 變異數分析 卡方檢定分析 相關分析 迴歸分析 資料分析推論統計 第二節 資料型態的種類與轉換 資料型態的呈現 常用的統計方法介紹 資料呈現的方式 第五節 預試 Excel SAS SPSS Minitab R 資料分析推論統計 第三節 問卷選項的注意事項 常用的統計表 常用的統計圖 常用的統計量數 資料分析 敘述性統 計

資料的處理 資料的接收和編輯 資料的編碼和輸入 資料的統計預處理 資料統計任務書的制定 資料記錄 資料檢查 資料校訂 資料編碼 資料輸入 資料檢誤 資料的編碼和輸入 資料的統計預處理 遺失值的處理 資料加權 編碼簿的編制 樣本資料結構 統計分析內容 資料統計任務書的制定

資料記錄(Data Recording) 在調查執行階段,應對調查結果,進行 初步的整理,其工作要點如下: 每日需回收已完成訪問的問卷資料,並記錄每天完成的問卷份數。 每份回收的問卷都需記錄完成的日期以及訪問人員的代碼,以便了解不同時間及不同人員的訪問品質。 每份問卷需設置屬於自己的識別碼號。 凡經手調查資料的人員都需詳實的記錄。

資料檢查(Data Checking) 對所回收的問卷進行確認與分類: 可接受的問卷 有問題的問卷 作廢的無效問卷

資料檢查(Data Checking) 檢查的要點如下: 問卷的受訪者需符合本次調查的篩選條件。 問卷的訪問時間是在規定的調查期程內。 問卷的內容需具備完整性,若缺失的內容是在可 容忍的範圍之外,則需要找到原本的受訪者進行 補問,否則該問卷視為無效。 回答模式需按問卷的詢問條件,即資料內容需按 問卷的設置要求。若沒有遵循問卷訪問規定的話, 須找到原本的受訪對象進行該題項的補問,否則 該問卷視為無效。

資料校訂(Data Editing) 工作內容-人員安排: 校訂員只負責全部問卷的某一部分內容進行校訂,此種方式對於每部分校訂的範圍較為精細可靠。 校訂員負責部份問卷的全部內容的校訂,此種方式易察覺問卷前後不一致的矛盾答案。

資料校訂(Data Editing) 工作內容-檢查問卷的答案 答案是否完整不遺漏? 字跡是否清晰可見? 答案是否有前後不一致的現象或者出現矛盾的地方? 開放式答案的敘述是否意義明確?

資料校訂(Data Editing) 工作內容-校訂過程 校訂員不可以隨意地更改答案。對於問卷上原始的答案不可以塗掉修改或者任意加上不必要的字句符號。 對於未說明或可更改範圍以外的問題時,校訂員要向負責的主管請示應如何作處理。 校訂員完成問卷校訂的工作,便應在問卷上記下名字或編號等,以便負責複核的主管進行查對的工作。

資料校訂(Data Editing) 工作內容-資料的處理 「空白」的處理: 對於答案出現空白的狀況時,應先探究發生的原因,若起因於調查員的疏忽所導致,則可詢問該名調查員並將答案補全。 若此時調查員已不記得答案,則可比照受訪者未作答的情形(視為「不知道」或「無答案」)或直接將該問卷作廢。

資料校訂(Data Editing) 工作內容-資料的處理 「不知道」的處理: 若出現不知道的答案次數不多,則可不加理會。 若出現的頻率過高時,則應該正視問題所發生的原因所在,因為極可能是由於問卷本身的設計出了問題,導致受訪者無法理解問卷的問題,故處理的方式是檢測問卷是否出現意義含糊不清的問題,或者難以理解的詞句用語。 再針對問卷重新修正,以改進問卷所發生的缺失。 若確定問卷設計上沒有發生問題,才能將不知道的答案,視為受訪者無法答覆或不願答覆來處理。 若是有辦法從問卷其他回答的資料中推測其可能的答案,則可用來取代「不知道」的回答。

資料校訂(Data Editing) 工作內容-資料的處理 「多項答案」的處理: 意指當面對一個問題時,受訪者可能答案不只一個;即所謂之「複選題」或是「開放題」。 依某一特定屬性的百分比來分析或者利用重複分析,將所有答案編表列示以瞭解答案的組合情形。 若是開放式作答的問題,處理的方式只要將所得的答案分門歸類即可。

資料檢誤(Data Cleaning) 檢核結構:檢查資料是否輸入在指定的行列位置上,以及檢視整個資料是否有輸入超過或輸入不足所要求的數量。 檢核範圍:檢查輸入的資料編碼範圍是否在規定的範圍內,例如選項只有「1」到「5」的情況,便不可能出現「6」或「6」以上的編碼範圍。 檢核邏輯:檢驗資料是否有相互矛盾的選項存在,例如依照邏輯思考,「男性」受訪者便不可能出現「懷孕」的記錄等。

調查資料的統計預處理 遺失值的處理 所謂「遺失值」(Missing Data)是指調查資料中,受訪者該填答之問題,未做填答。 一份調查資料若其遺失值的比例多於10%的情況下,就可能會使得該樣本資料產生推論的結果錯誤。

調查資料的統計預處理 資料加權 在進行資料分析之前會對樣本結果加以評估,檢視樣本結構與母群結構是否具有一致性。 符合一致性的話,則表示此調查資料具有代表性;若不符合時,則可透過加權手續讓樣本結構符合母羣結構的特質。 所謂的加權處理是指,將調查資料中每一筆資料(每位受訪者)均分別給予一個權重值,此權重值的意義是在於反映每筆資料的重要性。

遺失值的處理 刪除法: 將有遺失值的資料整筆刪除,此方法可能會有樣本數過少的問題。

遺失值的處理 成對排除法: 將有遺失值的資料保留,僅在相應的分析中將該資料排除不列入分析,故此方法在不同的分析內容中,其樣本數也不盡相同。 此方法很常被市場的研究人員採用,但需滿足三個條件, 樣本數很大 遺失值很少 變數之間的相關性不高

遺失值的處理 插補法 原理是將原本缺失的值補齊。 遺失值的取代方式有很多種,以下係整理一些較廣為使用的方法: 以成功樣本的平均值代入。 由統計模型計算得出該變數之期望值,取代遺失值。 選擇一個或數個與遺失值無關的變數作為分層的依據,以各分層內之成功樣本的平均值做為該層每一個遺失值的數值。

資料型態的分類

資料型態的轉換 比例尺度 區間尺度 順序尺度 區間尺度

各資料型態的統計量 比例尺度 區間尺度 順序尺度 名目 尺度 次數、比例、眾數 中位數、順序相關係數 平均值、變異數、標準差 相關係數、全距 倍率、增減率

適用的統計方法

不同尺度 適用的統計方法 應變數 自變數 屬質資料 屬量資料 Spearman相關 Pearson相關 卡方檢定 T檢定 迴歸分析 變異數分析

資料分析方法:列聯表 列聯表 Contingency Tables 列聯表的表示法 探討變數間是否有顯著關聯時用之 當資料為「屬質資料」時適用 又稱為「交叉表」(Cross-Tables) 可以清楚的陳列兩個分類變數之間的相互關係。 列聯表的表示法 觀察質表示法 期望值表示法 百分比表示法 列百分比 行百分比 總和百分比

資料分析方法: 次數分析表 次數分析表 Frequency Distribution Table 資料依類別或數量大小順序分成若干組,於各組內顯示其次數及百分比 適用於所有的資料

資料分析方法: 累積次數分析表 累積次數分析表 Cumulative Frequency Distribution Table 由次數分配表中的各組次數依序累計加總再利用各組的累積次數,編制累積次數分配表。 僅適用於屬量資料

統計圖-屬質資料 直條圖(Bar Chart): 圓餅圖(Pie Chart): 柱狀圖,是一種用作不同變項比較的圖表,特色在於可以區辨各個項目,並且作一相對性比較。 大致上主要的表現方式有兩種: 直條圖 橫條圖 圓餅圖(Pie Chart): 派圖,將資料數量的大小排列成圖形的一個部份,最常用來表示市場佔有率。

統計圖-離散型資料 點圖(Dot Chart): 線圖(Line Chart): 將資料依數字大小分類好之後,以畫點的方式呈現各組之分佈狀況 。 線圖(Line Chart): 次數分配圖,兩者都可以表示出增加或減少的絕對數量,比較的對象是前一變項。 累積次數分配圖,兩者都可以表示出增加或減少的絕對數量,比較的對象是總體變項。

統計圖-連續型資料 直方圖(Histogram): 多邊形圖(Polygon): 利用分組及次數(或百分比)資料 適用於資料屬連續型的變數(區間或比例尺度) 多邊形圖(Polygon): 將直方圖各長條位於橫軸上的中點亦即組中點直線相連接,即繪製成所謂的多邊形圖。

統計圖-連續型資料 累積次數分配圖(Cumulative Frequency Distribution): 又名肩形圖(Ogive)以累積次數或相對累積次數作圖示 分為以下累積和以上累積兩種方式。 散佈圖(Scatter Plot): 將資料繪製在兩個維度的空間上,可看出資料的散佈情形,通常用於觀察變數之間的相關性。

統計量數

資料分析方法-推論統計

獨立樣本T檢定 單一樣本T檢定 (One-sample T Test) 對樣本中某一變數的平均數()是否與符合母體平均數(μ)時的檢定

獨立樣本T檢定 兩個獨立樣本T檢定 (Independent-samples T test) 檢驗兩組資料之間的母體平均數(μ1與μ2)是否存在著差異性 兩組資料是分別來自兩個不同的母體

獨立樣本T檢定 成對樣本T檢定 (Paired-Sample T Test) 檢驗兩組資料之間的母體平均數(μ1與μ2)是否存在著差異性 兩組資料來自相同的母體

變異數分析 比較多個獨立群組「平均數」之間的變異 基本假設 單因子變異數分析 雙因子變異數分析 各組樣本的母體獨立。 各樣本的母體需服從常態分配。 各組樣本的母體變異數相同。 單因子變異數分析 雙因子變異數分析

卡方檢定分析 適合度檢定 (Goodness of Fit Test) 檢驗調查資料是否來自某一特定的母體分配

卡方檢定分析 齊一性檢定 (Test of Homogeneity) 檢定兩個或兩個以上的獨立樣本,其各類別比例是否相同的統計方法

卡方檢定分析 獨立性檢定 (Test of Independence) 檢測兩個類別變數之間是否有特殊的關聯

相關分析 衡量資料中兩個變數之間相關程度 透過相關係數了解兩變數之間的相關程度。

相關分析 Pearson相關分析 (Pearson Correlation Analysis) 適用於兩個變數的資料型態為「區間尺度」或「比例尺度」

相關分析 Spearman等級相關 (Spearman Rank-order) 適用於兩個變數都是「順序尺度」的資料

迴歸分析 探討一變數對另一變數的影響情形 研究和建立自變數和反應變數關係 以關係模式做為解釋及預測的工具

資料分析相關 之統計軟體 Excel SAS SPSS Minitab R