第 3 章 敘述統計II:數值方法 Part A (3.1~3.2).

Slides:



Advertisements
Similar presentations
首师大数学专业 教改调研与建言 1. 师范大学的教学理念 2. 师范大学的教学定位 3. 教学计划的三点建议.
Advertisements

“ 菸 ” 之非福 Part Ⅰ. 你的想法 ─ Q1 :你覺得他很有個性嗎? Q2 :吸菸會增加個人魅力嗎? Q3 :吸菸會讓人感覺成熟?
数 理 统 计 华南农业大学理学院应用数学系 Statistics Applied Mathematic Department, College of Sciences, SCAU.
青蘋果的代價 參考資料 : 國中性教育教學輔助媒體 (Power Point) 教師手冊. 影片欣賞 -- 愛的晚霞 單純的阿霞人生第一次的愛情,卻是帶來身心嚴重 的傷害,阿霞要如何面對感染愛滋後的生活 …
學會摘要 四年級 ( 內容擷取自劍潭國小陳錦蓮和詹珮怡老師的簡報 ). 2 分享綱要 1 1 什麼是摘要 2 3 如何教摘要 實例與實際操作.
我們可以如何應付氾濫 ? 2c 第三組. 目錄 防洪 (1) 防洪 (2) 湖北坪興建三峽主壩簡介 長江三峽水利樞紐工程 三峽工程的利益 (Part1) 三峽工程的利益 (Part2) 三峽工程的弊 (Part1) 三峽工程的弊 (Part2) 總結 組員名單 完.
1 寫作測驗武功秘笈 洪德惠老師 99 年 1 月 18 日. 2 PART1 理論部分 3 寫作測驗的基本能力 1. 能掌握寫作步驟,充實作品內容,精確表達自 己的思想。 2. 能依收集材料立意、選材、安排段落及組織等 步驟行文。 3. 能運用觀察的方法觀察周遭事物,並能寫下重 點。 4. 能適切地遣詞造句,使用正確的標點符號,完.
備審資料與面試準備 高雄醫學大學醫學系 林郁涵.
文亭淘宝城销售政策及租金政策 版权声明: 本文仅供客户内部使用,版权归北京和美行房地产经纪公司山东分公司所有,未经北京和美行房地产经纪公司山东分公司书面许可,不得擅自向其它任何机构和个人传阅、引用、复制和发布报告中的部分或全部内容。
窦娥冤 关汉卿 感天动地 元·关汉卿.
千秋大业在担当 《中国共产党问责条例》解读提纲.
第二章 语言测试的功能与分类 湖南师范大学外国语学院 邓 杰 教授.
資料分析 ---敘述統計分析.
營利事業所得稅查核準則 相關概念介紹 南區國稅局 新營分局 林俊標 各位學員大家好:
大型探索节目《谜》之 感恩.
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
Measures of location and dispersion
第2章 数据处理基础 2.1数据及数据类型 2.2 数据统计特性 2.3 数据预处理 2.4 相似性度量 据的中心度量
知其不可而为之.
307暑假作業 自選部份,各項的範例!.
8+2-3=? 統計 吳函儒、李雅芳 吳秉蓉、王農景 - =
中国画家协会理事、安徽省美术家协会会员、 工艺美术师、黄山市邮协常务理事余承平主讲
生命停看聽—生命圖書館 萬中選一的祝福 推薦人:彰師附工進修學校 蘇郁惠.
愛心月課程活動 設計者:洪雪玲老師.
《乡村教师支持计划 年》 解读.
1-3 探究自然的科學方法.
汉字的构造.
诵读欣赏 古代诗词三首.
學 號:997I0010、997I0024 組 員:洪韋鈴、王婷婷 日 期: 指導老師:王立杰 老師
姓名:梁晓莹 职务:安徽省旅游局安全办主任(高级经济师) 中国旅游研究院(华侨大学)旅游安全研究基地行业顾问 经历: 自1987年就职于安徽省旅游局 自2009年主持安全办工作 曾主编《旅游安全宣传手册——暨安徽旅游安全格言警句精选》、《安徽旅游安全》、《安徽旅游发展大事记》等 承办过“安徽省旅游安全演讲征文大赛”及“旅游安全调研成果奖”评选等工作.
機械工程學系課程地圖 先進材料與精密製造組 設計分析組 校訂共同必修課程 機械系訂 必修課程 組訂 必修課程 畢業專題 工學院訂必修課程
本活動 想解決的問題是……. 本活動 想解決的問題是…… 130最少要加上多少才能被8整除? 130最少要減去多少才能被8整除? 《除法定理》 被乘數=乘數 x 商 + 餘數.
第一章.
雞蛋這樣孵出小雞的 動物的生殖 Part I.
公司法(六) 股份有限公司 1.
*§8 反常二重积分 与反常定积分相同, 二重积分亦有推广到积分区域是无界的和被积函数是无界的两种情形, 统称为反常二重积分.
贴近教学 服务师生 方便老师.
統計學 授課教師:林志偉 Tel:5021.
六年级 语文 下册 第四单元 指尖的世界.
马克思主义基本原理概论 第三章 人类社会及其发展规律.
(浙教版)四年级品德与社会下册 共同生活的世界 第四单元 世界之窗 第二课时.
試算表軟體 II 醫務管理暨醫療資訊學系 陳以德 副教授: 濟世CS 轉
第十四章 数值变量的统计描述.
第 3 章 敘述統計:數值方法.
第 5 章 樣本資料的數值分布.
Sampling Theory and Some Important Sampling Distributions
第 3 章 敘述統計II:數值方法 Part B (3.3~3.6).
第一章 敘述統計學.
第 4 章 分散量數.
第四章 SPSS的基本统计分析.
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
敍述統計學 許明宗.
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
第 7 章 抽樣與抽樣分配 Part A ( ).
描述性统计学 作者 Dr. Maria Correa-Prisant 翻译 lvruiqin(DXY)
EXCEL+ORIGN+SPSS的描述统计
相關統計觀念復習 Review II.
準確性(Accuracy) 誤差種類 儀器準確度 時間因素 儀器參數.
Homework 1(1/2) 本頁表格為派密(Peavy)在07年球季各場次ERA的表現,(1)請依此數據完成下頁表格之統計值並說明之;(2)並與其他三名投手之統計值比較之。(請詳述計算過程) 場次 各場次ERA
Dr. C. Hsieh College of Informatics Kao yuan University
Chapter 5 z-Scores.
公务卡日常管理篇 办卡激活/遗失补办/ 停用销卡/额度调整 财务处 2016年.
(四)标准差(standard deviation)
楊志強 博士 統計學 楊志強 博士
Xián 伯 牙 绝 弦 安徽淮南市八公山区第二小学 陈燕朵.
生物统计学 Biostatistics 第一章 统计数据的收集与整理
第七章 计量资料的统计分析.
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
日本的蜻蜓.
Presentation transcript:

第 3 章 敘述統計II:數值方法 Part A (3.1~3.2)

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第78頁 統計實例 Small Fry Design 創設於 1997 年,它是一間設計與進口嬰孩玩具與配件用品的公司。 現金流量管理是日常營運中 最重要的項目之一。 在現金流量管理中,最重要的 就是分析與控制應收帳款帳戶 ,若能衡量未兌現支票平均到 期日與金額,管理者就可以預測何時收到現金,並且監督應收帳款帳戶的變化。 Small Fry Design 設定了以下目標:未兌現支票平均的到期日不能超過 45 天,到期日若有超過60 天的未兌現支票,總價值不能超過應收帳款總數的 5%。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第78頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第77頁 3.1 位置量數 3.2 離散量數 3.3 分配的形狀的量數,相對位置,以及離群值 的偵測 3.4 探究性資料分析 3.5 兩變數的相關性量數 3.6 加權平均數與群組資料的處理 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第77頁

3.1 位置量數 平均數 中位數 眾數 百分位數 四分位數 3.1 位置量數 平均數 測量值是由樣本資料計算 而得,則稱之為樣本統計量 (sample statistics)。 中位數 眾數 百分位數 若是由整個母體計算而得, 則稱之為母體參數 (population parameters)。 四分位數 統計推論中,樣本統計量是指 相對應的母體參數的 點估計量(point estimator)。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第77-79頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第79頁 平均數 一個變數最重要的位置量數或許是平均數 (mean 或 average value)。 若此資料來自某一母體,則以希臘字母 μ 表示之。 若此資料來自某一樣本,則平均數記為 x。 平均數是一種中央位置量數。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第79頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第79頁 平均數 x 資料集中 n 個觀察值 的總和 觀察值的樣本數 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第79頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第80頁 母體平均數 m 資料集中 N 個觀察值 的總和 觀察值的樣本數 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第80頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第79-80頁 表3.1 平均數實例 假設某大學的就業輔導室寄出一份問卷給被抽中的商學院畢業生,以調查工作起薪。 表3.1為所蒐集的資料。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第79-80頁 表3.1

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第79-80頁 平均數實例 樣本中12個商學院畢業生之平均起薪計算如下。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第79-80頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第80頁 中位數 中位數(median)是變數的另一種中央位置量數。 將資料值由小排到大時,中位數為中間的那一個值。 若資料個數為奇數時,中位數即位於中間的數值; 若資料項目為偶數時,就沒有單一的中間項。 根據傳統的中位數定義,將中間兩個值之平均數當 作中位數。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第80頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第80頁 中位數 將資料遞增排列(即由小到大排列) 資料值為奇數項時,中位數為此資料之中間值。 資料值為偶數項時,中位數為此資料之中間兩個數值的平均數。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第80頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第81頁 中位數實例 計算表 3.1 商學院12位畢業生起薪的中位數 將資料遞增排列後如下 因為n=12是偶數,故有兩個中間值:2,890和2,920,中位數為此兩個值之平均。 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325 中間兩個值 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第81頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第81頁 眾數 眾數(mode)眾數是資料集中出現次數最多的資料 值。 當資料集中出現次數最多的值有兩個或以上時, 眾數就不只一個。 若資料集恰有兩個眾數,則稱此資料為雙峰 (bimodal)。 若出現兩個以上的眾數時,則稱為多峰 (multimodal)。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第81頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第81-82頁 眾數實例 表2.2的清涼飲料購買狀況調查整理成如下的次數分配。 眾數,即最常購買的清涼飲料,是Coke Classic 。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第81-82頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第82頁 百分位數 百分位數(percentile)也是一種位置量數,有助於 瞭解資料在最小值與最大值間的分布情況。 針對那些沒有太多重複的資料集而言,p-百分位 數可將資料分割成兩部分,大約p-百分比的觀察 值會小於p-百分位數;而大約有(100-p)百分比 的觀察值會大於p-百分位數。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第82頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第82頁 百分位數 p-百分位數表示至少有 p-百分比 (百分之 p) 的觀察值小於或等於它,而至少有 (100-p) 百分比的觀察值大於或等於它。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第82頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第82頁 百分位數 將資料遞增排列,即由小到大排序。 計算指標 i p為百分位,n為觀察值的個數。 i = (p/100)n 若 i 不是整數,無條件進位後的整數即 p-百分位數 的位置。 若 i 是整數,則p-百分位數為資料排序後的第 i 個與 第 i+1 個觀察值之平均數。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第82頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第82-83頁 百分位數實例 求表3.1起薪資料的85-百分位數。 步驟 1. 將資料集的所有資料由小到大排序。 2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325 步驟 2. 步驟3. 因為 i 不為整數,無條件進位為11,即85-百分位數的位置指標。因此,85百分位數排在第11位。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第82-83頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第83頁 百分位數實例 再看看50-百分位數的計算過程,由步驟2得知 因為 i 是整數,步驟3(b)指出50-百分位數為排序資料的第6個與第7個數值的平均數;因此,50-百分位數為(2890+2920)/2=2905 。要注意的是,此處的50-百分位數也是中位數。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第83頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第83頁 四分位數 四分位數(quartiles)是百分位數的特例。 Q1 = 第一四分位數或25-百分位數 Q2 = 第二四分位數或50-百分位數(即中位數) Q3 = 第三四分位數或75-百分位數 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第83頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第83頁 圖3.1 四分位數 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第83頁 圖3.1

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第83頁 四分位數實例 將起薪資料再次重新由小到大排序後,第二四分位數(即中位數)為2905。 2710 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325 我們需利用找出25與75-百分位數的規則來得到第一四分位數Q1與第三四分位數Q3,計算如下。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第83頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第83-84頁 四分位數實例 對Q1而言: 因為 i 是整數,步驟3(b)指出第一四分位數,或25-百分位數,為第3個與第4個資料之平均數。因此,Q1 =(2850+2880)/2=2865。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第83-84頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第84頁 四分位數實例 對Q3而言: 因為 i 為整數,步驟3(b)指出第三四分位數,或75-百分位數,為第9個與第10個資料之平均數,因此, Q3 =(2950+3050)/2=3000。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第84頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第84頁 四分位數實例 四分位數將 12 個資料分成四部分,而每一部分均包含 25% 的觀察值。 我們定義了25-百分位數、50-百分位數、75-百分位數等三個四分位數後,便可利用計算百分位數的規則求出四分位數。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第84頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第84頁 評註 當資料集出現極端值時,中位數會比平均數更合適作為中央位置量數。極端值存在時,有時會用到另一種量數,稱做修正平均數 (trimmed mean) ,作法是刪除資料集的極小值與極大值後,剩下資料值的平均數即為修正平均數。例如, 5 %的修正平均數即是刪除最小的 5 %以及最大的 5 %觀察值後得到的平均數。以表 3.1 的 12 筆起薪為例, 12 筆資料的 5 %是 12 × 0. 05 = 0.6,將 0.6 進位為 l ,表示 5 %的修正平均數是將最高的一筆起薪與最低的一筆起薪刪除後,再求平均值。因此,以 10 筆資料求得的 5 %的修正平均數是 2924 . 50。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第84頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第88頁 3.2 離散量數 除了位置量數外,我們還常希望能知道離散量數 或變異量數。 例如,選擇兩家不同的供應商訂貨,不僅要考慮 其平均運送時間,還要考慮其運送時間的變異性。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第88頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第88-91頁 3.2 離散量數 全距 四分位數距 變異數 標準差 變異係數 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第88-91頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第88-89頁 全距 最簡單的離散量數就是全距(range)。 全距 = 最大值 - 最小值 全距僅用到資料中的兩個值,因此深受極端值 的影響。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第88-89頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第89頁 全距實例 參考表 3.1 商學院畢業生的起薪資料,最大值是 3,325,最小值是 2,710,全距就是3325-2710=615。 假設有一位畢業生的每月起薪是 $10,000,此例中的全距變為 10000-2710=7290 而不是 615,這個值並不是非常適合描述資料集的變動性,因為 12 個資料中的 11 個資料均是在 2,710 與 3,130 之間。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第89頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第89頁 四分位數距 四分位數距(interquartile range, IQR) 這個離散量 數是第三四分位數 Q3 與第一四分位數 Q1 的差。 IQR= Q3- Q1 IQR為中間50% 資料的全距。 能克服極端資料值的離散量數。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第89頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第89頁 四分位數距實例 參考表3.1商學院畢業生的起薪資料,對每月起薪資料而言,第三四分位數與第一四分位數分別為 Q3=3000 與 Q1=2865,因此,IQR 為 3000-2865=135。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第89頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第89頁 變異數 變異數(variance)是利用到全部資料的離散量數。 變異數是根據每一個觀察值( xi )與平均數之差而 求得。每一個觀察值 xi 與平均數( 為樣本平均 數,μ為母體平均數)之差稱為離差(deviation about the mean)。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第89頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第89-90頁 變異數 當樣本平均數的差距平方和除以n-1,而非n 時,此樣本變異數為母體變異數的不偏估計量 變異數之定義如下: 樣本變異數 母體變異數 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第89-90頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第90頁 變異數實例 利用3.1節中5個大學班級人數的樣本為例。 資料的彙總在表3.3,包括離差及離差的平方。離差平方的總和為 Σ( xi - )2 =256。因此,在n-1=4時,樣本變異數為 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第90頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第90頁 表3.3 變異數實例 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第90頁 表3.3

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第90頁 變異數實例 表3.1的起薪資料為例,說明樣本變異數的計算,在3.1節中,我們算出樣本平均起薪值為2,940。樣本變異數(s2=27,440.91)的結果列於表3.4。 表3.3與3.4中值得注意的是,我們算出離差與離差平方的總和。對於任何資料集,離差的總和必為0。因此,如同表3.3與表3.4顯示 Σ( xi - )2 =0,這是恆成立的,因為正的離差與負的離差會相互抵消,而使得離差的總和為0。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第90頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第91頁 表3.4 表3.4 起薪資料樣本變異數的計算 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第91頁 表3.4

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第91頁 標準差 標準差(standard deviation)的定義是變異數的 正平方根。 標準差比變異數容易解釋,因為標準差的衡量 單位與資料相同。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第91頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第91頁 標準差 由變異數得到標準差的方法如下。 樣本標準差 母體標準差 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第91頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第91頁 標準差實例 以表3.1的起薪資料為例,樣本標準差為  s = =165.65。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第91頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第91-92頁 變異係數 變異係數是變異性的相對衡量,它衡量標準差 相對於平均值的大小。 變異係數計算如下: 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第91-92頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第92頁 變異係數實例 以表3.1起薪資料為例,其樣本平均數 2940 與樣本標準差 165.65,變異係數為[(165.65/2940)×100]%=5.6%。 一般而言,欲比較具有不同的標準差與平均數的資料之離散程度時,變異係數是一個有用的統計量。 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第92頁

第3章敘述統計II:數值方法 Part A (3.1~3.2) 第90-92頁 表3.1起薪資料為例 變異數 標準差 此樣本之標準差佔平均數的5.6% 變異係數 第3章敘述統計II:數值方法 Part A (3.1~3.2) 第90-92頁

End of Chapter 3, Part A