第三章 敘述統計量.

Slides:



Advertisements
Similar presentations
©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
Advertisements

林惠玲 陳正倉著 雙葉書廊發行 2009 第 4 章 分析資料 - 以統計測量數呈現 1 統計學 方法與應用 四版上冊 第 4 章 分析資料 - 以統計測量數呈現.
單元九:單因子變異數分析.
Ch12 資料分析.
資料分析 ---敘述統計分析.
樞紐分析與資料庫 蕭世斌 Nov 20, 2010.
Describing Data: Numerical Measures
Measures of location and dispersion
期望值 變異數 共變異數與相關係數 變異數與共變異數之性質 柴比雪夫不等氏 動差與動差生成函數
單元四:資料的描述(二) ㄧ、集中趨勢統計量數 二、分散程度統計量數.
統計學(Statistics) 其 目的 應用.
量化研究與統計分析 Data Graphing 國立臺灣體育運動大學 高明峰
參考書籍:林惠玲與陳正倉(2002),應用統計學(第二版)。台北:雙葉書廊有限公司。
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
第三章 敘述統計(II)——統計量數 3.1 集中趨勢量數 3.2 差異量數 3.3 平均數與標準差的應用 3.4 偏態量數、峰態量數與動差
商用統計學 Chapter 3 敘述統計(二) – 統計量數.
數 據 分 析 林煜家 魏韶寬 陳思羽 邱振源.
17 類別資料的分析  學習目的.
Chapter 3 第三章 Numerical Descriptive Measures 數值量測及資料描述
第三章 资料的统计描述 上一张 下一张 主 页 退 出.
3.1 集中趋势的度量 3.2 离散程度的度量 3.3 偏态与峰态的度量
第一章.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
統計量 (一) 大綱:算術平均數 中位數 眾數 顧震宇 台灣數位學習科技股份有限公司.
資料的整理與呈現 表格化法與製圖法 中心位置測定值 分散度測定值 變異係數
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
統計學 授課教師:林志偉 Tel:5021.
量化研究與統計分析 Data Graphing
第 3 章 敘述統計:數值方法.
第 5 章 樣本資料的數值分布.
第一章 敘述統計學.
國中統計課程 Excel 函數應用 臺中市立后里國民中學 賴勝豐.
第 4 章 分散量數.
敘述統計 2.1 次數分配 2.2 統計量數 個案:樣本敘述 商管研究資料分析SPSS的應用 Chapter 2 敘述統計.
單一分配 Uniform distribution
本章重點: 一、集中量數的意義和種類 二、算術平均數 三、中位數(中數) 四、眾 數 五、其他集中量數 六、SPSS12.0實務操作
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
敍述統計學 許明宗.
第三章 敘述統計量 陳順宇 教授 成功大學統計系.
第一章 敘述統計學 1.1 原始資料 1.2 統計表 1.3 統計圖 1.4 統計量值 一些經驗法則 44 ©2009 陳欣得
第二章 機率概論 2.1 相對次數與機率 樣本空間、事件與隨機變數 抽樣與樣本空間 22
第十章 順序資料之假設檢定 10.1 順序資料檢定概論 10.2 符號檢定 10.3 符號秩檢定(成對樣本檢定)
第3章 變異量數與分佈形狀.
第一章 直角坐標系 1-3 函數圖形.
本章學習目標 學習極座標繪圖與對數繪圖 學習雙y軸繪圖 學習向量場繪圖 學習統計繪圖 在Matlab的環境裡製作動畫
Definition of Trace Function
小學四年級數學科 8.最大公因數.
信度分析 (11/7~11/13) 1.何謂『信度』 2.信度分析步驟.
Dr. C. Hsieh College of Informatics Kao yuan University
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
第三章 平均数、标准差与变异系数 第一节 平均数 上一张 下一张 主 页 退 出.
Review of Statistics.
Ogive plot example 說明者:吳東陽 2003/10/10.
Chapter 4 Variability 離散趨勢測量 2019/4/26.
Keller: Stats for Mgmt & Econ, 7th Ed 數值的敘述方法
第二章 統計學概論.
生物統計與SAS軟體課程教學(二) 單變項描述 (Descriptive Statistics)
楊志強 博士 統計學 楊志強 博士
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
第十四章名義資料的數字 描述:關連測量 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
第四章 統計資料的整理:統計量數.
課程三 描述統計:次數分配、中央趨勢.
資料表示方法 資料儲存單位.
生物统计学 Biostatistics 第一章 统计数据的收集与整理
第一章 直角坐標系 1-3 函數及其圖形.
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
描述統計 Descriptive Statistics
11621 : Small Factors ★★☆☆☆ 題組:Problem Set Archive with Online Judge
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
Presentation transcript:

第三章 敘述統計量

概論 統計量包括五種類型 中央趨勢之衡量統計量 分散度之衡量統計量 相對位置之衡量統計量 形狀之衡量統計量 兩變數線性相關之衡量統計量

3.1中央趨勢之衡量統計量 中央趨勢之衡量統計量(measure of central tendency)主要是衡量資料的中心位置,故又稱為中心之衡量(measure of center) 一般較常用的中央趨勢之衡量統計量有平均數(mean)、中位數(median)、眾數(mode)等

3.1.1 平均數 平均數是最常用的一種中央趨勢之衡量統計量,它最大的功用即在能以一個簡單的數代表母體或樣本的數值 適合用數學運算方法,計算簡單且易於了解 計算一組統計資料的平均數時,該組資料內的所有數值皆被列入計算,所以較具有代表性且敏感度高 平均數的唯一缺點是容易受到極端值(extreme value)的影響,而減弱平均數的代表性

3.1.1 平均數(續) 平均數以求算方式可分為三種 ,即 但後兩種平均數較不常見,應用範圍也不廣 。 算術平均數(arithmetic mean) 幾何平均數(geometric mean) 調和平均數(harmonic mean) 但後兩種平均數較不常見,應用範圍也不廣 。

3.1.1 平均數(續) 平均數的意義 以全部觀測值的總和除以觀測值個數而得

3.1.1 平均數(續) 平均數的計算 統計資料未分組時由於仍然完整,因此在求算統計量時不會有任何問題,但資料經過分組後,即會失去某些資訊 求算已分組資料的統計量時,一般都是依循下列兩個基本假設 1. 集中分配:假設各組觀測值都相等於組中點 2. 均勻分配:假設各組觀測值都是均勻分佈在組內

3.1.1 平均數(續)

3.1.1 平均數(續)

3.1.1 平均數(續) 【例3.3】承例2.3,某一班級50名學生的統計學期中考成績的次數分配如下所示,試求其平均成績。

3.1.1 平均數(續)

3.1.1 平均數(續)

3.1.1 平均數(續) 平均數的特性

3.1.1 平均數(續) *Key to solve

3.1.2 中位數

3.1.2 中位數(續)

3.1.2 中位數(續)

3.1.2 中位數(續) 中位數的特性 在資料無嚴重的重複情形下,中位數將資料分為兩等分 各觀測值xi與中位數Me之差的絕對值總和,比和其他任意數之差的絕對值總和都來得小, 即 ,T為任一常數

3.1.2 中位數(續)

3.1.3 眾數 定義3.1.9 眾數 一組統計資料中,出現次數最多之觀測值即為眾數(mode),一般均以Mo表示之 定義3.1.10 未分組資料的眾數 在計算未分組的統計資料之眾數時,可先將數值依大小排列,其中出現次數最多的數值即為眾數;但若某一數值很明顯地佔全部資料中最大比例時,則此時不必將資料排列也可找到眾數。

3.1.3 眾數(續)

3.1.3 眾數(續) 求已分組資料之眾數的方法 ,一般最常見的有以下三種 金氏(W.I. King)插補法 克如伯(E. Czuber)比率法 皮爾生(K. Pearson)法

3.1.3 眾數(續)

3.1.3 眾數(續)

3.1.3 眾數(續)

3.1.3 眾數(續)

3.1.3 眾數(續)

3.1.4 各中央趨勢之衡量統計量之比較 適用性表較

3.1.4 各中央趨勢之衡量統計量之比較(續) 優缺點比較

3.1.4 各中央趨勢之衡量統計量之比較(續)

3.2 分散度之衡量統計量 分散度之衡量統計量可衡量資料之離散程度 分散度之衡量統計量可以用於尋找變異的原因和性質 常見的分散度之衡量統計量有:全距、四分位差、平均絕對差、變異數及標準差、變異係數等

3.2.1 全距 定義3.2.1 全距 資料中的最大值與最小值之差即為全距(range),通常以R來表示。

3.2.1 全距(續)

3.2.1 全距(續) 全距的性質 計算簡單,意義明顯 具有順序統計量的概念 易受極端值影響 缺乏敏感度

3.2.2 四分位差 四分位差是指將資料去掉兩端最大及最小值各25%的觀察值,只剩中間50%部分的資料,之後再求這50%資料的全距

3.2.3 平均絕對離差 計算各觀察值與平均數的距離總和,然後在取其算術平均數,而不討論離均差之正負號,此即為平均絕對離差(mean absolute deviation),通常以MAD表示

3.2.3 平均絕對離差(續)

3.2.3 平均絕對離差(續)

3.2.3 平均絕對離差(續)

3.2.3 平均絕對離差(續) 平均絕對離差的特性 其值越大,則資料的分散情況也越大;反之,則越小 平均絕對離差的優點 觀念簡單,易於了解 敏感度較高,代表性較佳 平均絕對離差的缺點 當資料數多時,較不易計算 易受極端值的影響

3.2.4 變異數與標準差 變異數(variance)的概念,是將各個資料與其平均數之間的離差平方後再加總除以總項數後即為變異數

3.2.4 變異數與標準差(續)

3.2.4 變異數與標準差(續) 未分組資料的標準差

3.2.4 變異數與標準差(續)

3.2.4 變異數與標準差(續) 已分組資料的標準差

3.2.4 變異數與標準差(續)

3.2.4 變異數與標準差(續)

3.2.4 變異數與標準差(續) 變異數與標準差的特性 其理論的結果在往後的機率理論佔有相當重要的地位 分散度之衡量統計量中優點最多的 變異數與標準差的重要的性質 值恆大於或等於零 ,其值越大代表資料分散程度越大;反之則分散程度越小 只能用來比較兩組或兩組以上平均數相近且具有相同單位之資料間分散程度的大小

3.2.4 變異數與標準差(續) 變異數與標準差的優缺點 優點: 靈敏度較高 將中央趨勢之衡量統計量(平均數)列入計算、且適合用代數演算。 適合用樣本變異數s2對未知的母體變異數2進行估計,而且s2是2的不偏估計 缺點 :易受極端值的影響

3.2.5 變異係數 所謂的相對分散度之衡量統計量就是絕對分散度之衡量統計量與某一中央趨勢之衡量統計量或其它適當數量之比 一般最常用的相對分散度之衡量統計量是變異係數(coefficient of variance),通常以CV表示,變異係數乃標準差與平均數比值的百分數

3.2.5 變異係數(續)

3.2.5 變異係數(續)

3.2.5 變異係數(續)

3.2.5 變異係數(續) 變異係數的特性 變異係數為一種無單位的係數 變異係數具有下列兩種使用時機: 當單位不同的兩組或兩組以上的資料欲比較分散程度時 當單位相同但數值相差懸殊的資料欲比較分散程度時

3.3 位置之衡量統計量 位置之衡量統計量(measures of location)是用來測量某觀測值在全部樣本資料中排序後的累積相對百分比,或是給某相對百分比求對應的量是多少。

3.3.1 百分位數

3.3.1 百分位數(續)

3.3.1 百分位數(續)

3.3.1 百分位數(續)

3.3.1 百分位數(續)

3.3.1 百分位數(續)

3.3.1 百分位數(續)

3.3.2 四分位數

3.3.2 四分位數(續)

3.3.2 四分位數(續)

3.3.2 四分位數(續)

3.3.2 四分位數(續)

3.3.3 Z值

3.3.3 Z值(續)

3.4 形狀之衡量統計量 形狀之衡量統計量(measures of shape)是用來描述一組資料的分配形狀,如是否對稱,或資料分佈形狀的峰度有多高等等問題 一般最常用的即為偏態係數及峰態係數。

3.4.1 偏態係數 所謂偏態(skewness)係指一組單峰分配資料分配不對稱的程度 偏態係數(coefficient of skewness)為表示單峰分配偏態的一種係數,故其亦為一種統計表徵數

3.4.1 偏態係數(續) 偏態係數的範圍大致在正負三之間,偏態係數的絕對值越大表示偏斜程度越大 Sk=0為對稱(symmetric);Sk>0為右偏(skewed right),或稱正偏;Sk<0為左偏(skewed left),或稱負偏。

3.4.1 偏態係數(續)

3.4.2 峰度係數 峰度(kurtosis)是指次數分配高峰高聳的程度 常態分配的高峰叫做常態峰(Mesokurtic),當CK(峰態係數)=3 次數分配中較常態峰高而狹者叫做高狹峰(Leptokurtic) ,當CK>3 較常態峰低而闊者叫做低闊峰(Platkurtic) ,當CK<3

3.4.2 峰度係數(續)

3.5 謝比雪夫不等式與經驗法則

3.5 謝比雪夫不等式與經驗法則(續)

3.5 謝比雪夫不等式與經驗法則(續)

3.5 謝比雪夫不等式與經驗法則(續)

3.5 謝比雪夫不等式與經驗法則(續)

3.6 探索性資料分析 探索性資料分析(exploratory data analysis;EDA)強調以簡單的繪圖方式彙總來描述一組樣本資料 探索性資料分析主要包括兩種最常用的圖形,即枝葉圖(stem-and-leaf diagrams)和箱形圖(box and whisker plots)

3.6.1 枝葉圖

3.6.2 箱形圖 箱形圖(box-and-whisker plot)又叫做箱鬚圖係將某些中央趨勢之衡量統計量與分散度之衡量統計量利用圖形表現出來的一種圖示法 圖中含顯示出資料的最大值L(largest)、最小值S(smallest)、第一四分位數(Q1)、中位數(Me)、第三四分位數(Q3)、四分位距(IQR)等

3.6.2 箱形圖(續) Q1=46 Me=62 Q3=75 S=22 L=96

3.7 兩變數線性相關之衡量統計量 3.7.1 共變異數

3.7.1 共變異數(續)

3.7.1 共變異數(續)

3.7.1 共變異數(續)

3.7.2 相關係數

3.7.2 相關係數(續)

3.7.2 相關係數(續)

3.7.2 相關係數(續)

3.7.3 共變數與相關係數間的關係

3.7.3 共變數與相關係數間的關係(續)

3.7.3 共變數與相關係數間的關係(續) (續下頁)

3.7.3 共變數與相關係數間的關係(續)