資料分析前的預備動作— 資料清理、編碼與資料分析

Slides:



Advertisements
Similar presentations
©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
Advertisements

單元九:單因子變異數分析.
無母數統計檢定 (Nonparametric Tests)
實驗規劃--實驗因子設定, 效標選定與受測者選定
Ch12 資料分析.
樞紐分析與資料庫 蕭世斌 Nov 20, 2010.
公會組織糾紛 指導老師:柯伶玫 組員 495B0065 劉致維 495B0072 廖怡塵 495B0097 范家皓.
CHAPTER 9 量化研究Ⅳ - 資料處理與分析 -.
參考書籍:林惠玲與陳正倉(2002),應用統計學(第二版)。台北:雙葉書廊有限公司。
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
行銷研究 單元二 行銷研究的程序.
應用統計學 授課大綱 – 暑期班 By: Dr. Tsung-Nan Tsai.
假設檢定之基本概念 單一母體平均數之假設檢定 假設檢定與信賴區間之相關性 兩母體平均數之假設檢定  
數 據 分 析 林煜家 魏韶寬 陳思羽 邱振源.
判斷步驟 Step 1 :判斷是否為常態分配 Step 2 :如果是常態分配,用「假設檢定」,如果不是請看 Step 3
17 類別資料的分析  學習目的.
運用網路資源趣味化 「每日飲食指南份量」教學
統計數量分析幾個重要的觀念 陳順宇 教授.
迴歸分析 主講人:童超塵 實驗室網址 永久: 實驗室網址 永久: 目前:
能量買賣訊號 ◎波段賣訊:下列四項出現三項以上(含三項) 1、空方能量升至整波上漲之最高水準,且空方能量>多方 能量30%以上。
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
無母數統計方法 符號檢定法 W-符號等級檢定法 W-等級和檢定法 K-W檢定法 連檢定 結論
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
教育人員退休新法說明會 106年12月14日 ★資料來源:參考銓敘部及高雄市教育局人事室簡報檔.
一、緒論 1. Introduction.
第零章 統計學概論 0.1 統計學的定義 0.2 敘述統計學與推論統計學 0.3 測量尺度 0.4 資料、資訊與因果關係 ©2009 陳欣得
國文(一) 1.第一單元---青春印記 (學習篇、愛情篇) 2.第二單元---生活美學 3.第三單元---優遊家園.
統計軟體工作坊 輕鬆學會統計軟體R 2013/05/23.
第六章 平均數比較 6-1 平均數比較(各種 T Test 的應用) 6-2 Means 平均數分析 6-3 單一樣本 T 檢定
統計期末報告 指導老師:蘇明俊 組員:休二甲 蔡曉萱 張銘芳 林佳芳
Using EXCEL for ANOVA.
課程九 迴歸與相關2.
統計學期末報告 指導老師:蘇明俊老師 組員名單: 林姻秀 韓孟珊 王若婷
敘述統計 2.1 次數分配 2.2 統計量數 個案:樣本敘述 商管研究資料分析SPSS的應用 Chapter 2 敘述統計.
統計學期末報告 指導老師:蘇明俊老師 組員名單: 林姻秀 韓孟珊 王若婷
介紹SPSS SPSS 本為 Statistical Package for the Social Sciences 的簡寫,由於產品及功能不斷地擴充,目前改名成 Statistical Product and Service Solutions。
第二章 SPSS的使用 2.1 啟動SPSS系統 2.2 結束SPSS系統 2.3 資料分析之相關檔案 2.4 如何使用SPSS軟體.
指導老師: 蘇明俊 老師 組長:潘翠娥 組員:張惠雅 葉麗華
第四章 原始資料的電腦化 Computerized Raw Data.
第十四章 單因子變異數分析 14.1 前言 14.2 單因子變異數分析理論 14.3 功能視窗 14.4 範例
統計學 指導老師: 郭燿禎 Date: 2/14/12.
第十章 順序資料之假設檢定 10.1 順序資料檢定概論 10.2 符號檢定 10.3 符號秩檢定(成對樣本檢定)
第 7 章 推論方法.
估計與假設檢定.
國立台灣體育學院 體育學系暨體育研究所 高明峰
有關於股票報酬及匯率變化對台灣醫療產業市場收益的分析
Chapter 1 多變量統計方法介紹. Chapter 1 多變量統計方法介紹 變數資料之類型 以衡量尺度分類 以變數的角色分類 名目尺度(nominal scale ) 序列尺度(ordinal scale) 區間尺度(interval scale) 比率尺度(ratio scale) 以變數的角色分類.
第12章 資料整理與量化研究 範例分析(一).
7-2 抽樣分配(sampling distribution)
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
第十章 證券投資組合.
楊志強 博士 統計學 楊志強 博士
第三章 敘述統計量.
Review of Statistics.
Chapter 4 Variability 離散趨勢測量 2019/4/26.
Keller: Stats for Mgmt & Econ, 7th Ed 數值的敘述方法
Introduction to Basic Statistics
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
第十四章名義資料的數字 描述:關連測量 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
第七章 資料轉換和 個案選擇 7.1 前言 7.2 〝Recode〞功能 7.3 〝Compute〞功能 7.4 〝Count〞功能
第四章 統計資料的整理:統計量數.
※歡迎挑戰,兩人(隊)中先完成連線即算過關!
勞工保險年金制度 簡報人:吳宏翔.
Chapter 3 相關與變異數分析. Chapter 3 相關與變異數分析 變數的內涵 屬量變數 屬質變數 當一個變數可以量化、計算,而且其值的大小可以做有意義的比較時,則稱為屬量變數 當一個變數的內容是屬於敘述性的(如:快樂/憂鬱、男/女),則即使我們可以將其量化,這些量化之後的數值不但在邏輯上不能運算,其大小的比較也沒有意義,這種變數即稱為屬質變數.
法律的解釋 楊智傑.
參考書籍:林惠玲與陳正倉(2002),《應用統計學第二版》。台北:雙葉書廊有限公司。
假說檢定程序 3.1 定義 3.2 假說檢定程序 3.3 檢定的種類與方法 3.4 統計檢定精神 個案:假說建立
Chapter 1 多變量統計方法介紹. Chapter 1 多變量統計方法介紹 變數資料之類型 以衡量尺度分類 以變數的角色分類 名目尺度(nominal scale ) 序列尺度(ordinal scale) 區間尺度(interval scale) 比率尺度(ratio scale) 以變數的角色分類.
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
Presentation transcript:

資料分析前的預備動作— 資料清理、編碼與資料分析

編碼—事前編碼 收到問卷後,要將問卷資料輸入電腦中,以便進行分析 輸入資料前,須先進行編碼的工作 例1:當題目為性別:□男 □女,則輸入電腦時,可能會輸入「男」、「女」,或轉換成數字,如「1」、「0」。 例2:□很滿意 □普通 □不滿意,會編碼成3, 2, 1 編碼的目的 將問卷結果轉換成電腦可辨識與可進行分析的模式

資料清理 遺漏值 極端值 對受訪者太多無填或者亂答的狀況進行處理 若是太多問題無填答(約50%的題數未填答),則此問卷可歸為廢卷。 廢卷標準可由研究者自訂 系統性填答 可利用標準差進行判斷 若某受訪者在該量表( Ex. 滿意程度)的標準差為 0,代表受訪者填答的選項都一樣,研究者可以考慮將此問問歸為廢卷

編表與資料清理

編表的功能 找出錯誤 Ex. 出現不該出現的數値:選項介於1~4,填答結果為5 發現異常觀察值 極端值:影響分析結果 了解未回答(空白)的主要原由 刻意迴避 or 不知道(答案) 決定變數的分配型態 變數的分配不同,適用的檢定方法亦不同 Ex. 是否符合常態分配 計算平均數和離散度 了解所蒐集到樣本的特性

編表有清理資料的功能!

簡單編表—敘述統計表

資料尺度類型與適用敘述統計量 尺度的種類 數值處理 敘述統計方法 名目尺度 計數 計算頻率、百分比 順序尺度 排列順序 排列順序、中位數、計算百分等級 區間尺度 算數計算 平均數、變異數、標準差 比率尺度

次數與比率分析 受訪者150人 出席狀況:□按時上課 □偶爾未到(一星期約5次以下) □經常未到(一星期6~10次) □常常未到(一星期11次以上) 結果 按時上課:50人(33.3%) 偶爾未到:60人(40%) 經常未到:30人(20%) 常常未到:10人(6.67%)

次數分配表 目的 了解分佈的狀況 課堂參與狀況 人數 百分比 按時上課 50 33.33% 偶爾未到 60 40.00 經常未到 30 20.00 常常未到 10 6.67 150 100.00

亦可以圖形的方式呈現資料狀態

受訪者150人 性別:□男 □女 男生:75人(50%) 女生:75人(50%)

直方圖—受訪者性別比率

交叉編表(1/2) 目的 初步了解,不同母體之間,是否存在差異 Ex. 不同性別的學生,其上課出席狀況是否有所不同 課堂參與狀況 人數 男生 女生 合計 按時上課 30 20 50 偶爾未到 25 35 60 經常未到 15 常常未到 7 3 10 77 73 150

交叉編表(2/2) 如欲了解,不同性別的學生,其上課出席狀況是否存在明顯(統計顯著)差異,則建議使用卡方分析

卡方檢定—齊一性檢定(1/2) 隨機抽樣調查330位女大學生,獲得其就讀年級與選購化妝品主要目的的資料,如下表: 請問,不同年級學生選購化妝品的主要目的是否明顯不同?

假設檢定 對母體特性建立一個正面及一個反面的敘述,藉由樣本資料判斷假設對錯的過程。 正面的敘述為虛無假設(Null Hypothesis, H0) 反面的敘述為對立假設(Alternative Hypothesis, H1) H0通常為與期望結果相反的敘述

卡方檢定—齊一性檢定(2/2) 在α=0.01下,檢定不同年級女大學生的化妝品使用目的是否相同 假設檢定 H0:不同年級學生選購化妝品的主要目的相同 H1:不同年級學生選購化妝品的主要目的不相同 統計量χ2 vs. χ20.01(6)

兩變數均為屬質變數(名目尺度、順序尺度)! 卡方檢定的使用時機 兩變數均為屬質變數(名目尺度、順序尺度)!

敘述統計量 目的 可快速了解樣本的特徵 統計量類型 平均數:代表資料的集中趨勢 種類:算術平均數、中位數、幾何平均數、眾數 哪種統計量不易受極端值影響? 離勢:代表資料的離散程度 種類:全距、四分位差、變異數、標準差

敘述統計量—範例 Ex.問卷題目 性別:□男 □女 您所選購筆記型電腦的重量為_____kg 針對第二小題,可以分析 性別:□男 □女 您所選購筆記型電腦的重量為_____kg 針對第二小題,可以分析 受訪者所購筆電的重量區間為何(最重、最輕)? 受訪者所購筆電的平均重量為何? 可以計算眾數、中位數嗎? 受訪者所購筆電重量的變異數為何? 購買筆電的重量是否受性別差異的影響?

Ex.問卷題目 性別:□男 □女 您所選購筆記型電腦的重量為_____kg 欲了解購買筆電的重量是否受性別差異的影響? 該怎麼分析?

可使用分析方法 有母數 t檢定:單一樣本、兩組樣本 ANOVA:多組樣本 無母數 Mann-Whitney U檢定:兩組樣本 Kruskal-Wallis檢定法 :多組樣本

假設檢定 對母體特性建立一個正面及一個反面的敘述,藉由樣本資料判斷假設對錯的過程。 正面的敘述為虛無假設(Null Hypothesis, H0) 反面的敘述為對立假設(Alternative Hypothesis, H1) H0通常為與期望結果相反的敘述

假設檢定的範例 行政院長的執政能力遭立法委員質疑,據悉已有超過一半的委員不滿意。 以p代表立法委員不滿意的比例,則假設檢定可定為何 (H0)? or

某減肥食品公司宣稱其產品A較另一公司之產品B更有效果。以X代表服用產品A與B所減輕重量之差,則假設檢定之虛無假設與對立假設該如何定義?

相關係數 相關係數用來判定兩個變數間線性關係之強度 Ex.問卷題目包括: 網路購物佔您總消費金額的比率為何?_____% 您平均每日上網時數? 您想了解,網購佔總消費金額的比率與平均每日上網時數間,是否存在(線性)關聯。

迴歸分析 目的:了解多個變數之間,是否存在線性相關 Ex.問卷題目包括: 網路購物佔您總消費金額的比率為何?_____% 您每月可支配所得多少錢?_____ 您平均每日上網時數? 您覺得網路購物是否又保障? □有保障 □沒感覺 □沒保障 你想了解,網購佔總消費金額的比率主要是受哪些因素影響?(可支配所得、上網時數、對網路安全的觀感)