第四章 統計資料的整理:統計量數.

Slides:



Advertisements
Similar presentations
©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
Advertisements

2007 年广州市初中信息技术 结业考试海珠区质量分析 海珠区教育发展中心 范谊 2007 年 9 月 8 日.
林惠玲 陳正倉著 雙葉書廊發行 2009 第 4 章 分析資料 - 以統計測量數呈現 1 統計學 方法與應用 四版上冊 第 4 章 分析資料 - 以統計測量數呈現.
單元九:單因子變異數分析.
Ch12 資料分析.
資料分析 ---敘述統計分析.
基礎統計:資料之蒐集整理與分析 2.1 資料之型態 2.2 資料蒐集 2.3 伯拉圖分析 2.4 直方圖 2.5 製程集中趨勢之衡量
樞紐分析與資料庫 蕭世斌 Nov 20, 2010.
Describing Data: Numerical Measures
期望值 變異數 共變異數與相關係數 變異數與共變異數之性質 柴比雪夫不等氏 動差與動差生成函數
單元四:資料的描述(二) ㄧ、集中趨勢統計量數 二、分散程度統計量數.
統計學(Statistics) 其 目的 應用.
二、以圖表描述資料 2. Charts & Graphs.
量化研究與統計分析 Data Graphing 國立臺灣體育運動大學 高明峰
參考書籍:林惠玲與陳正倉(2002),應用統計學(第二版)。台北:雙葉書廊有限公司。
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
第三章 敘述統計(II)——統計量數 3.1 集中趨勢量數 3.2 差異量數 3.3 平均數與標準差的應用 3.4 偏態量數、峰態量數與動差
綜合性指標之應用 中國醫藥大學 醫務管理研究所 馬作鏹 博士.
行政作用法 行政命令.
數 據 分 析 林煜家 魏韶寬 陳思羽 邱振源.
17 類別資料的分析  學習目的.
Chapter 3 第三章 Numerical Descriptive Measures 數值量測及資料描述
3.1 集中趋势的度量 3.2 离散程度的度量 3.3 偏态与峰态的度量
第一章.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
統計量 (一) 大綱:算術平均數 中位數 眾數 顧震宇 台灣數位學習科技股份有限公司.
資料的整理與呈現 表格化法與製圖法 中心位置測定值 分散度測定值 變異係數
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
量化研究與統計分析 Data Graphing
Chap3 Descriptive statistics -numerical measures Minitab & Excel
社會學(一) 空中大學花蓮中心 鍾燕菁
點狀圖 (Dot Plot).
課程九 迴歸與相關2.
第一章 敘述統計學.
第 4 章 分散量數.
敘述統計 2.1 次數分配 2.2 統計量數 個案:樣本敘述 商管研究資料分析SPSS的應用 Chapter 2 敘述統計.
單一分配 Uniform distribution
介紹SPSS SPSS 本為 Statistical Package for the Social Sciences 的簡寫,由於產品及功能不斷地擴充,目前改名成 Statistical Product and Service Solutions。
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
第2章 集中量數.
敍述統計學 許明宗.
第三章 敘述統計量 陳順宇 教授 成功大學統計系.
第 3 章 敘述統計II:數值方法 Part A (3.1~3.2).
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
第一章 敘述統計學 1.1 原始資料 1.2 統計表 1.3 統計圖 1.4 統計量值 一些經驗法則 44 ©2009 陳欣得
第二章 機率概論 2.1 相對次數與機率 樣本空間、事件與隨機變數 抽樣與樣本空間 22
第3章 變異量數與分佈形狀.
3-2 資料的分析 主題1 算術平均數、中位數與眾數 主題2 百分位數與四分位數 主題3 盒狀圖、全距與四分位距 重點整理 自我評量.
小學四年級數學科 8.最大公因數.
Homework 1(1/2) 本頁表格為派密(Peavy)在07年球季各場次ERA的表現,(1)請依此數據完成下頁表格之統計值並說明之;(2)並與其他三名投手之統計值比較之。(請詳述計算過程) 場次 各場次ERA
7-2 抽樣分配(sampling distribution)
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
第三章 敘述統計量.
Review of Statistics.
Chapter 4 Variability 離散趨勢測量 2019/4/26.
Keller: Stats for Mgmt & Econ, 7th Ed 數值的敘述方法
第二章 統計學概論.
生物統計與SAS軟體課程教學(二) 單變項描述 (Descriptive Statistics)
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
第十四章名義資料的數字 描述:關連測量 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
課程三 描述統計:次數分配、中央趨勢.
生物统计学 Biostatistics 第一章 统计数据的收集与整理
第一章 直角坐標系 1-3 函數及其圖形.
Test for R Data Processing & Graphics
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
描述統計 Descriptive Statistics
11621 : Small Factors ★★☆☆☆ 題組:Problem Set Archive with Online Judge
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
Presentation transcript:

第四章 統計資料的整理:統計量數

1: 產生數據 2: 整合 數據 3: 從數據中得出結論 推論正確性之判斷 資料分析解釋 問題確認 研究對象之確認 資料蒐集 資料整理 推論 統計 機率論 敘述 統計 抽樣 母體 樣本 1: 產生數據 2: 整合 數據 3: 從數據中得出結論

資料之統計量數 以統計量數來表達資料的特性 集中趨勢統計量數 位置統計量數 分散程度統計量數 形狀統計量數

集中趨勢測量值 集中趨勢統計量數顯示資料的中心位置所在 平均數 (mean; average) 中位數 (median) 眾數 (mode) 資料總合 除以 資料個數 中位數 (median) 眾數 (mode)

(算術)平均數 母體平均數 [mju] 資料個數為 N 資料分別為: μ

樣本平均數 [x-bar] 資料個數為 n 資料分別為:

EX:4-1

平均數的特性 平均數是資料的平衡點(重心所在) 各觀察值( ) 與平均數之差的平方和為最小

優點:使用到每一個觀察值 缺點:容易受極端值的影響 (ex:4-2) 可對觀察值予以加權(加權平均數)

資料的平衡點

學生成績報告單(加權平均數)

合併資料後之平均數計算 第一組資料 個別資料: 資料共 第一組資料的平均數= 第一組資料的總合 =

第二組資料 個別資料: 資料共 第一組資料的平均數= 第一組資料的總合 =

合併兩組資料後之平均數

Exercise: 4-18 (pp. 97)

中位數 (median) 將觀察值依數值由小至大 (或由大至小) 排列後,位於中央(中間)的數值。 若資料個數 N (n) 為奇數

圖4.3 中位數

EX: 4-3 EX: 4-4

中位數的特性 有50%的資料小於或等於中位數 有50%的資料大於或等於中位數 優點:不容易受極端值影響 缺點:不容易進行代數演算 當資料分布型態有所偏斜時,最好用中位數 缺點:不容易進行代數演算 EX: 無法將兩組資料的個別中位數作運算而求得合併兩組資料後的中位數 中位數不常用來做統計推論

各觀察值( ) 與平均數之距離(絕對離差)最小

眾數 (mode) 觀察值中出現次數最多的那一個數值 眾數之符號 眾數的性質 EX: 4-5, 4-6 不受極端值影響 可能有多個或沒有 唯一可應用於屬質資料的中央趨勢統計量數。 EX: 4-5, 4-6

中央趨勢統計量數之比較(一) 若資料之次數分配圖(直方圖)為對稱: 若資料之次數分配圖(直方圖)為右偏: 平均數 = 中位數 = 眾數 (圖 4.4) 若資料之次數分配圖(直方圖)為右偏: 眾數 < 中位數 < 平均數(圖 4.5) 若資料之次數分配圖(直方圖)為左偏: 平均數 < 中位數 < 眾數(圖 4.6)

中央趨勢統計量數之比較(二) 當數據資料為屬量資料時 當數據資料為屬質資料時 平均數受極端值的影響最為明顯 中位數或眾數對極端值較不敏感  可用平均數或中位數作為中央趨勢統計量數 當數據資料為屬質資料時  應以眾數作為中央趨勢統計量數 平均數受極端值的影響最為明顯 中位數或眾數對極端值較不敏感 平均數易於作代數運算

位置測量值 百分位數 四分位數

百分位數 第 p 百分位數: 將資料由小至大排序後, 至少有 p% 的觀測值小於或等於第 p 百分位數

計算步驟 將資料由小至大排列 計算 資料位置 I = P/100 * n 若 I 為非整數,則比I大的最小整數為第P 百分位數所在之位置 若 I 為整數,則第 I 及第 I+1 個觀測值之平均值即為第 P 百分位數

EX: 4-7

四分位數 第 1 四分位數 Q1 = 第 25 百分位數 第 2 四分位數 Q1 = 第 50 百分位數 EX: 4-8

分散程度統計量數 分散程度代表一種距離的概念 資料分散程度有時比集中趨勢更為重要 分散程度代表差異性與風險程度 種類 全距 四分位距 平均絕對離差 變異數 標準差 變異係數(兩組資料之比較)

甲廠商交貨期的分配

圖4.9 乙廠商交貨期的分配

全距 (range) 全距 R= 最大值 – 最小值 缺點 只考慮最大與最小,不能精確反應全體觀察值的分散情形 容易受極端值影響

資料的分散情形

四分位距 四分位距 IQR (inter-quartile range) = 第 3 四分位數 – 第 1 四分位數 = Q3 – Q1

12家電腦公司營業收入

平均絕對離差MAD 離差 = 個別資料 -平均數 絕對離差 = | 個別資料 -平均數 | = 個別資料與平均數之間的距離

平均絕對離差

冷氣機價格的平均絕對離差 9800

變異數 (variance) 變異數 = 母體變異數

樣本變異數

冷氣機價格的變異數 9800

變異數性質 將每一觀察值均列入考慮 亦受極端值影響

合併資料後之變異數計算 第一組資料 個別資料: 資料共 第一組資料的平均數= 第一組資料的變異數

第二組資料 個別資料: 資料共 第二組資料的平均數= 第二組資料的變異數

合併兩組資料後之平均數= 合併兩組資料後之變異數

標準差 (standard deviation) 標準差 = 將變異數開根號 變異數的度量單位和原來觀測值的單位不同,但開根號後就補救了此一缺點。

標準差的性質 只有在以平均數來描述一組資料之中央趨勢時,才可以標準差來描述其離散趨勢。 當所有觀測值均相同時,標準差(變異數)為零。 標準差越大代表觀測值離平均數散佈的越遠。 標準差與平均數一樣,均會被少數極端值嚴重影響

比較兩組資料之分散程度 變異係數 (coefficient of variation) *100% 變異係數是沒有單位的

五數綜合 一組資料的五數綜合包括: 當資料之分佈圖(直方圖)有所偏斜時,五數綜合通常好過用平均數及標準差 最小值,Q1(第一個四分位數),中位數,Q3,(第三個四分位數) ,最大值 當資料之分佈圖(直方圖)有所偏斜時,五數綜合通常好過用平均數及標準差 只有在資料分佈大致對稱時,才用平均數及標準差

探索屬量資料的策略 一、先畫莖葉圖或直方圖 二、尋找整體型態(形狀、中心及離度)及離群值 三、選擇用五數綜合或者平均數及標準差來簡略描述資料之中心及離度

盒鬚圖 (I) 最小值 中位數Me 最大值 Q1 Q3 IQR

盒鬚圖 (II) 上圍籬值 最小值 下圍籬值 中位數 最大值 Q1 Q3 偏離值 1.5(IQR) 1.5(IQR)

形狀測量值 偏度(skewness) 峰度(kurtosis) 經驗法則 vs. 柴比氏定理

偏度 (skewness) Pearson 偏態係數 對稱分配  平均數 = 中位數 偏度 =0 測量一組資料對稱與否的指標 對稱分配  平均數 = 中位數 偏度 =0 右偏 平均數 > 中位數 偏度 > 0 左偏 平均數 < 中位數 偏度 < 0

峰度 (kurtosis) 峰度 測量一組資料分佈形狀峰度有多高的指標 常態分配的峰度  峰度 = 3 峰度比常態高峻  峰度 > 3 峰度比常態低闊  峰度 < 3

圖4.25 三種峰度的圖形 K>3 K=3 K<3

柴比雪夫不等式 (Chebyshev’s Inequality) 對於任意型態之資料:

經驗法則 對於資料呈現對稱分配或鐘型分配:

N/A 大約 68% >= 75% 大約 95% >= 89% 大約 99.7% 柴比雪夫不等式 經驗法則 N/A 大約 68% >= 75% 大約 95% >= 89% 大約 99.7%

Z分數 主要應用於兩組資料(平均數不定一相同; 標準差不一定相同) 中某兩個個別資料的比較 Z分數代表個別資料與平均數之間的距離有幾個標準差 EX:大學甄試中的口試 Z分數代表個別資料與平均數之間的距離有幾個標準差 將個別資料減去平均數再除以標準差的過程稱為標準化

Z > 0  資料大於平均數 Z < 0  資料小於平均數 Z = 0  資料等於平均數

資料同加一常數的變化 平 移

資料同乘一常數的變化 乘以 c

資料之線性轉換 乘以 加上 k c

Z分數之平均數與變異數 c k