第 3 章 敘述統計II:數值方法 Part B (3.3~3.6).

Slides:



Advertisements
Similar presentations
高三英语有效复习策略 程国学. 一、高考备考的方向把握 1. 认真研究普通高中《英语课程标准》和《福建 省考试说明》关注高考命题原则和发展方向,定 准复习教学起点 1. 认真研究普通高中《英语课程标准》和《福建 省考试说明》关注高考命题原则和发展方向,定 准复习教学起点 一是明确高考英语可能考什么,我们应该怎样准.
Advertisements

考纲研读 语言知识要求 语言运用能力 附录 1: 语音项目表 附录 2: 语法项目表 附录 3: 功能意念项目表 附录 4: 话题项目表 附录 5: 词汇表 听力 阅读 写作 口语.
北京市卫生和计划生育委员会. 目录目录 2 1 汇审工作安排 2 年末结账及明年建账关注事项 3 卫生年报口径讲解 4 财政决算口径讲解.
“ 菸 ” 之非福 Part Ⅰ. 你的想法 ─ Q1 :你覺得他很有個性嗎? Q2 :吸菸會增加個人魅力嗎? Q3 :吸菸會讓人感覺成熟?
100 學年度 勞委會就業學程 國際企業管理學系-物業管理學程介紹. 何謂物業管理? 以台灣物業管理學會 所述,物業管理區分為 「物」、「業」、「人」三區塊。台灣物業管理學會 「物」係指傳統的建物設備、設施 「業」為不動產經營的資產管理 「人」則以生活服務、商業服務為主,並以人為 本位連結物與業,形成今日物業管理三足鼎立新.
學會摘要 四年級 ( 內容擷取自劍潭國小陳錦蓮和詹珮怡老師的簡報 ). 2 分享綱要 1 1 什麼是摘要 2 3 如何教摘要 實例與實際操作.
我們可以如何應付氾濫 ? 2c 第三組. 目錄 防洪 (1) 防洪 (2) 湖北坪興建三峽主壩簡介 長江三峽水利樞紐工程 三峽工程的利益 (Part1) 三峽工程的利益 (Part2) 三峽工程的弊 (Part1) 三峽工程的弊 (Part2) 總結 組員名單 完.
1 寫作測驗武功秘笈 洪德惠老師 99 年 1 月 18 日. 2 PART1 理論部分 3 寫作測驗的基本能力 1. 能掌握寫作步驟,充實作品內容,精確表達自 己的思想。 2. 能依收集材料立意、選材、安排段落及組織等 步驟行文。 3. 能運用觀察的方法觀察周遭事物,並能寫下重 點。 4. 能適切地遣詞造句,使用正確的標點符號,完.
--- 黄其红 大数据时代下 互联网金融与第三方支付研究. 4. 离开导 致错过叫 号 1. 天弘 “ 增利宝 ” 余额宝 “ 不差钱 ” 模式探讨 互联网金融是我国传统金 融与互联网相结合的产物, 其实际上是对我国传统金融 的补充。 关键词:余额宝 供求模型 投资渠道 互联网创新 3. 用互联 网思维来.
图书馆管理实务.
備審資料與面試準備 高雄醫學大學醫學系 林郁涵.
文亭淘宝城销售政策及租金政策 版权声明: 本文仅供客户内部使用,版权归北京和美行房地产经纪公司山东分公司所有,未经北京和美行房地产经纪公司山东分公司书面许可,不得擅自向其它任何机构和个人传阅、引用、复制和发布报告中的部分或全部内容。
窦娥冤 关汉卿 感天动地 元·关汉卿.
行政命令.
草虫的村落 执教者:罗小妍 升华        交往1        交往2        演奏        劳动        分工        回应        拓展       
共产党领导的多党合作和政治协商制度: 中国特色的政党制度.
千秋大业在担当 《中国共产党问责条例》解读提纲.
主讲:材料工程学院党总支宣传委员、党务秘书 教工党支部书记 王国志 2015年12月7日
普通高中新课程实验 若干问题 广东省教育厅教研室 吴惟粤 2004年4月29日 广州.
前言 採購程序每一環節所涉及人員,無論是訂定招標文件、招標、審標、決標、訂約、履約管理、驗收及爭議處理,如缺乏品德操守,有可能降低採購效率與品質,影響採購目標之達成,甚有違法圖利情事發生,致阻礙政府政策之推動並損害公共利益。因此,較之一般公務人員,採購人員更需遵循較高標準之道德規範。 主講人:林中財.
欢迎新同学.
2015年新课标高考历史试题分析 暨考试方向研判 李树全 西安市第八十九中学.
课题四 以天池、博斯腾湖 为重点的风景旅游区
資料分析 ---敘述統計分析.
“健康的基督徒” 入门.
南台科技大學電子工程系 指導老師:楊榮林 老師 學生姓名:蔡博涵 巨物索餌感測裝置(第II版)
營利事業所得稅查核準則 相關概念介紹 南區國稅局 新營分局 林俊標 各位學員大家好:
大型探索节目《谜》之 感恩.
2015年汕头一模质量分析会 34(1)题分析 濠江区河浦中学 詹金锋 34(2)题分析 汕头市实验学校 董友军
士師逐個捉(II) 石建華牧師 24/07/2016.
知其不可而为之.
宣讲数学课程标准 增强课程改革意识.
高考地理全国卷和安徽卷 的对比分析及备考策略
快乐生活,快乐学习 《中国古代诗歌散文欣赏》.
2013年二手车市场环境分析.
班級經營之再思 香港班級經營學會 黃鳳意
中国画家协会理事、安徽省美术家协会会员、 工艺美术师、黄山市邮协常务理事余承平主讲
佛法原典研習 五陰誦 (II) 2007/5/13 整理此報告的方式 : 主要節錄 果煜法師說法之重點.
生命停看聽—生命圖書館 萬中選一的祝福 推薦人:彰師附工進修學校 蘇郁惠.
地方機關組織編制及職務歸系法規與實務作業研習
2014年度合肥市中小学生学业质量 绿色指标测试相关情况说明及考务工作要求
普通高中课改方案介绍.
曾一 陈策 重庆大学计算机学院基础科学系 重庆
凉山州2015届高考情况分析 暨2016届高三复习建议 四川省凉山州教育科学研究所 谌业锋.
课题:人的高贵在于灵魂 湘潭就业职校:杨秀红.
愛心月課程活動 設計者:洪雪玲老師.
《乡村教师支持计划 年》 解读.
1-3 探究自然的科學方法.
汉字的构造.
诵读欣赏 古代诗词三首.
學 號:997I0010、997I0024 組 員:洪韋鈴、王婷婷 日 期: 指導老師:王立杰 老師
新企业所得税 税收优惠表填报操作实务 江苏宿迁 吴健.
姓名:梁晓莹 职务:安徽省旅游局安全办主任(高级经济师) 中国旅游研究院(华侨大学)旅游安全研究基地行业顾问 经历: 自1987年就职于安徽省旅游局 自2009年主持安全办工作 曾主编《旅游安全宣传手册——暨安徽旅游安全格言警句精选》、《安徽旅游安全》、《安徽旅游发展大事记》等 承办过“安徽省旅游安全演讲征文大赛”及“旅游安全调研成果奖”评选等工作.
本活動 想解決的問題是……. 本活動 想解決的問題是…… 130最少要加上多少才能被8整除? 130最少要減去多少才能被8整除? 《除法定理》 被乘數=乘數 x 商 + 餘數.
雞蛋這樣孵出小雞的 動物的生殖 Part I.
公司法(六) 股份有限公司 1.
贴近教学 服务师生 方便老师.
統計學 授課教師:林志偉 Tel:5021.
六年级 语文 下册 第四单元 指尖的世界.
我国的人民民主专政.
(浙教版)四年级品德与社会下册 共同生活的世界 第四单元 世界之窗 第二课时.
第 3 章 敘述統計:數值方法.
第 3 章 敘述統計II:數值方法 Part A (3.1~3.2).
Chapter 5 z-Scores.
公务卡日常管理篇 办卡激活/遗失补办/ 停用销卡/额度调整 财务处 2016年.
Xián 伯 牙 绝 弦 安徽淮南市八公山区第二小学 陈燕朵.
統計網路學習館 線性迴歸.
這七個故事很簡短,但她們說的都是一個主題——愛情!真心希望你們每個故事都看一下,不會用很長時間,但保證你能感到那種被震撼的感覺!
日本的蜻蜓.
Presentation transcript:

第 3 章 敘述統計II:數值方法 Part B (3.3~3.6)

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第77頁 3.3 分配的形狀的量數,相對位置,以及離群 值的偵測 3.4 探究性資料分析 3.5 兩變數的相關性量數 3.6 加權平均數與群組資料的處理 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第77頁

3.3 分配的形狀的量數,相對位 置,以及離群值的偵測 3.3 分配的形狀的量數,相對位 置,以及離群值的偵測 分配的形狀 z 分數 柴比雪夫定理 經驗法則 離群值的偵測 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第95-98頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第95頁 分配的形狀:偏度(skewness) 一分配形狀的重要數值衡量則是偏度(skewness)。 計算偏度的公式有些複雜。 衡量樣本的偏度公式是: 但是若以統計軟體來計算,則是輕而易舉。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第95頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第95-96頁 圖3.3 分配的形狀:偏度(skewness) 對稱 (不偏) 偏度為 0 。 對稱分配的平均數及中位數是相等的。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第95-96頁 圖3.3

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第95-96頁 圖3.3 分配的形狀:偏度(skewness) 適度左偏 偏度為負值。 平均數常小於中位數。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第95-96頁 圖3.3

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第95-96頁 圖3.3 分配的形狀:偏度(skewness) 適度右偏 偏度是正值。 平均數通常大於中位數。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第95-96頁 圖3.3

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第95-96頁 圖3.3 分配的形狀:偏度(skewness) 高度右偏 偏度是正值。 (通常大於1.0) 平均數通常大於中位數。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第95-96頁 圖3.3

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第95頁 圖3.3 分配的形狀:偏度(skewness) 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第95頁 圖3.3

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第96頁 z 分數 z 分數通常稱為標準化值(standardized value)。 每個 xi 會有一個稱之為 z 分數(z -score)的數值 與之對應。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第96頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第96頁 z 分數 利用平均數與標準差,我們便能決定任何觀察 值的相對位置。 資料集小於樣本平均數則 z 分數小於 0。 資料集大於樣本平均數則 z 分數大於 0。 資料集等於樣本平均數則 z 分數等於 0。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第96頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第96-97頁 表3.5 z 分數實例 表 3.5 是班級人數資料的 z 分數,之前算出平均數為 =44,樣本標準差為 s=8。第 5 個觀察值的 z 分數為 -1.50,是離平均數最遠的資料值,比平均數小 1.50個標準差。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第96-97頁 表3.5

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第97頁 柴比雪夫定理 在資料集內,至少有 (1-1/z2) 百分比的觀察值 與平均數的差距必須在 z 個標準差之內,z 為任 何大於 1 之值。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第97頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第97頁 柴比雪夫定理 至少有 0.75 或 75% 的觀察值,與平均數 的差距在 z=2 個標準差之內。 至少有 0.89 或 89% 的觀察值,與平均數 的差距在 z=3 個標準差之內。 至少有 0.94 或 94% 的觀察值,與平均數 的差距在 z=4 個標準差之內。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第97頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第97頁 柴比雪夫定理實例 若某學院商用統計課程有 100 位學生修課,期中考成績之平均數為 70,標準差為 5。有多少學生的分數介於 60 與 80 之間?又有多少學生的分數介於 58 與 82 之間? 我們注意到 60 的值是小於平均數 2 個標準差,而80 則是大於平均數 2 個標準差。利用柴比雪夫定理,我們可看出至少 0.75 或至少75% 的觀察值與平均數的差距必須在兩個標準差之內。因此,100 個學生至少有75 人分數介於 60 與 80 之間。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第97頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第97頁 柴比雪夫定理實例 而分數介於 58 與 82 的人數又是多少?我們可看出 (58-70)/5=-2.4,表示58 是小於平均數 2.4 個標準差;而 (82-70)/5=+2.4,表示 82 大於平均數 2.4 個標準差。利用柴比雪夫定理 z=2.4,我們可得到 至少有82.6%的學生的分數必須介於58與82。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第97頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第98頁 經驗法則 針對鐘形分配的資料集而言: 大約 68% 的觀察值與平均數的差距在一個標準差內。 大約 95% 的觀察值與平均數的差距在二個標準差內。 幾乎所有的觀察值與平均數的差距在三個標準差內。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第98頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第98頁 圖3.4 經驗法則 99.72% 95.44% 68.26% x m m – 3s m – 1s m + 1s m + 3s m – 2s m + 2s 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第98頁 圖3.4

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第98-99頁 離群值的偵測 有時資料集會有一個或更多極大或極小的觀察值。 使用 z 分數確認離群值時,觀察值之 z 分數若 小於−3或大於3,就是離群值。 離群值可能是 未被正確登錄的資料 被錯放在資料集 離群值若是登錄正確的資料,而且也屬於這 個資料集的話,則必須保留。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第98-99頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第98頁 離群值的偵測 根據資料分析制定決策時,最好先檢查離群值。誤差通常產生自記錄資料,並將其輸入電腦時。並非一定要刪除離群值,但必須適當確認其正確性與適當性。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第98頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第99頁 離群值的偵測實例 參考表 3.5 的班級人數資料之 z 分數,z 分數為 -1.50 表示第 5 個觀察值為離平均數最遠的值。然而,此標準化值仍在 -3 到 +3 之間,因此,z 分數顯示出在班級人數資料中並無離群值。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第99頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第99頁 評註 柴比雪夫定理適合用於任何的資料集,用來指出至少有多少個觀察值與平均數的差距在特定個標準差之內。若資料集已知為鐘形時,則會得到更多的訊息。例如,經驗法則告訴我們:有大約 95% 的觀察值與平均數的差距在兩個標準差之內;由柴比雪夫定理所得到的結論只是:至少有 75% 的觀察值會在上述的差距之內。 在分析一個資料集之前,統計學者通常做各種檢查以確信資料的有效性。在大型研究中,登錄資料或將資料鍵入電腦的過程中發生錯誤也很常見。確認離群值是檢查資料有效性的方法之一。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第99頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第102頁 3.4 探究性資料分析 五數彙總 箱形圖 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第102頁

五數彙總(five-number summary) 1 最小值 2 第一四分位數 (Q1) 3 中位數 (Q2) 4 第三四分位數 (Q3) 5 最大值 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第102頁

五數彙總(five-number summary)實例 表 3.1 中 12 位商業學校畢業生的薪資若以遞增順序排列的話可以得到下列資料。 由3.1節已知中位數為2905,Q1=2865且Q3=3000。再回顧此資料集之最小值為2710,而最大值為3325。因此,此資料集之五數彙總為2710, 2865, 2905, 3000, 3325。大約有1/4或25% 的資料值會介於這五數的兩兩間隔之間。 2755 2850 2880 2880 2890 2920 2940 2950 3050 3130 3325 Q1=2865 Q2=2905 Q3=3000 (中位數) 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第102頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第102頁 箱形圖 箱形圖(box plot)是根據五數彙總而繪製的圖形。 繪製箱形圖的關鍵在中位數與四分位數(Q1與Q3), 也用到四分位數距 IQR=Q3-Q1。 箱形圖是另一種辨別離群值的方法。但是這種 方法不見得會與用 z 分數找出的離群值相同。 運用兩種方法或只用任一種方法皆可行。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第102頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第103頁 圖3.5 箱形圖 圖3.5為月薪資料的箱形圖以及上、下界線。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第103頁 圖3.5

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第102頁 箱形圖 繪製箱形圖的步驟如下: 箱形的製作以第一四分位數、第三四分位數為前後邊。以起薪資料為例,Q1=2865, Q3=3000,箱形包含中間50% 的資料值。 箱形中的垂直線位置為中位數 (以起薪資料而言是 2905)。因此,中位數位置的直線將所有資料分割成兩等分。 使用四分位數距 IQR=Q3-Q1 時,必須設定界限 (limits),箱形圖的界限分別位於 Q1 之下1.5(IQR)或 Q3 之上1.5(IQR)。對起薪資料而言,IQR= Q3-Q1 =3000-2865=135。因此,界限為 2865-1.5(135)=2662.5 與 3000+1.5(135)=3202.5。在界限之外的值為離群值。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第102頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第102-103頁 箱形圖 圖 3.5 的虛線稱之為鬚 (whiskers)。鬚的畫法是從步驟 3 中箱形的兩邊至界限內最大值與最小值,以圖 3.5 為例,分別是 2710 與 3130。 最後,以 * 表示離群值的位置;在圖 3.5 中,可看到一個離群值 3,325。 圖 3.5 中有標示上、下界限的直線。這些線用來標示資料的範圍,雖然我們會算出這些數值,但在箱形圖中通常不會顯示出來。圖 3.6 是起薪資料的箱形圖的一般形式。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第102-103頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第103頁 圖3.6 箱形圖 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第103頁 圖3.6

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第103頁 評註 探究性資料分析過程的優點之一是容易使用;需要的計算很少,我們僅是將資料由小到大排序並找出中位數與第一四分位數、第三四分位數去獲得五數彙總,便可很容易的做出箱形圖,並不需要計算資料的平均數與標準差。 附錄 3.1 將說明如何以 Minitab 繪製起薪資料箱形圖,其箱形圖與圖 3.6 相似,只是圖形轉了 90°。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第103頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第107.109頁 3.5 兩變數的相關性量數 共變異數 相關係數 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第107.109頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第106.108頁 共變異數 共變異數(covariance)是兩變數間線性相關的 敘述量數。 共變異數為正值表示正相關。 共變異數為負值表示負相關。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第106.108頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第107頁 共變異數 樣本共變異數 樣本共變異數 母體共變異數 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第107頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第106頁 表3.7 共變異數實例 回顧 2.4 節立體音響設備店的例子。該店的經理有興趣研究未來幾個週末的電視廣告與銷售量的關係,樣本資料列於表 3.7 中。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第106頁 表3.7

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第106頁 圖3.7 共變異數實例 圖 3.7 為兩變數的散佈圖,其顯示出一種正向的關係:較高的銷售量 (y) 伴隨著較高的廣告次數 (x)。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第106頁 圖3.7

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第107頁 共變異數實例 為了測量廣告次數 x 與銷售額 y 的線性關係之強度,我們利用式(3.10)計算樣本共變異數。表3.8是 的計算過程。請注意   =30/10=3且  =510/10=51,利用式(3.10),可得共變異數為 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第107頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第107頁 表3.8 共變異數實例 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第107頁 表3.8

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第108頁 圖3.8 共變異數的意義 以圖3.8來解釋樣本共變異數。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第108頁 圖3.8

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第109頁 圖3.9 圖3.9 樣本共變異數的解釋 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第109頁 圖3.9

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第109頁 圖3.9 圖3.9 樣本共變異數的解釋 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第109頁 圖3.9

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第109頁 圖3.9 圖3.9 樣本共變異數的解釋 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第109頁 圖3.9

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第111-112頁 相關係數 相關係數的範圍由−1到+1。 樣本相關係數為 1 代表兩變數 x 與 y 之間是完全 正線性相關。 一個樣本相關係數為-1 代表兩變數 x 與 y 之間 是完全負線性相關。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第111-112頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第110頁 相關係數 皮爾生相關係數 樣本資料 母體資料 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第110頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第112頁 相關係數 相關係數讓我們瞭解兩個變數間線性相關的 程度,而非因果關係存在與否。 兩變數間的高度相關並不表示兩變數間必然有 因果關係。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第112頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第110頁 相關係數實例 以立體音響設備店的資料為例,求其樣本相關係數。利用表3.8的資料,我們便能計算兩變數的樣本標準差。 因為 sxy=11,可得到樣本相關係數為 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第110頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第111頁 相關係數實例 圖3.10的散佈圖是根據以下樣本資料而得。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第111頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第111頁 圖3.10 相關係數實例 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第111頁 圖3.10

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第111頁 相關係數實例 通過這三點的直線顯示變數 x 與 y 存在有完全線性相關。為了套用式 (3.12) 來計算樣本相關係數,必須先算出 sxy, sx 與 sy,某些計算過程列在表 3.9。運用表中的資料,我們發現 因此,樣本相關係數為1。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第111頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第112頁 相關係數實例 假設某一特定資料集顯示 x 與 y 間有正線性相關但不是完全正線性相關,rxy 之值將會小於1,表示在散佈圖上的點並非全部落在一條直線上。當資料點愈來愈偏離完全正線性相關, rxy的值會愈變愈小。 rxy之值等於零表示 x 與 y 之間沒有線性關係,且 rxy之值接近零表示一種微弱的線性相關。 以立體音響設備店的資料為例, rxy =+0.93,因此,我們的結論是:廣告次數與銷售量之間存在強大正的線性關係。更明確地說,廣告次數增加時,銷售量也增加。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第112頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第112頁 表3.9 相關係數實例 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第112頁 表3.9

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第114-118頁 3.6 加權平均數與群組資料的處理 加權平均數 群組資料的樣本平均數 群組資料的樣本變異數 群組資料的標準差 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第114-118頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第115頁 加權平均數 是在某些情況為了反映個別觀察值的重要性, 計算平均數時要對每一觀察值加上權重,以此 方式計算而得到的值即稱加權平均數(weighted mean)。 當資料來自樣本時,式(3.15)提供了樣本加權平均 數的算法,當資料來自母體時,我們可以用 μ 取 代 ,則式(3.15)也可用來計算母體加權平均數。 加權平均數中所使用的權重依實際情況各有不同。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第115頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第115頁 加權平均數 其中: xi = 第 i 個觀察值 wi = 第 i 的觀察值的權重 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第115頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第115頁 加權平均數實例 以下是一個加權平均數的例子,我們以過去3個月所做的5次採購來做說明。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第115頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第115頁 加權平均數實例 我們可以由資料中觀察到,每磅成本由 $2.80至 $3.40不等,而且採購數量在500至2,750磅之間,假設經理想要瞭解原料每磅的平均成本,由於訂購數量各有不同,所以我們必須應用加權平均數的觀念。資料顯示5筆原料每磅成本分別為 x1=3.00, x2=3.40, x3 =2.80, x4=2.90,以及 x5=3.25,則每磅成本的加權平均成本等於每項成本乘上其對應採購量加權而得。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第115頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第115頁 加權平均數實例 所以,本例的權重分別為 w1=1200, w2=500, w3 =2750, w4=1000,以及w5 =800,應用式(3.15),我們可以求得加權平均數: 因此,由加權平均數的計算,可以得到原料的每磅平均成本等於 $2.96。值得注意的是,若我們使用式 (3.14) 而非加權平均數的公式,將誤導結果。因為,(3.00+3.40+2.80+2.90+3.25)/5=15.35/5=$3.07。這個結果高估了每磅平均採購成本。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第115頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第115-116頁 加權平均數實例 加權平均數中所使用的權重依實際情況各有不同。以學生的平均成績為例,4代表 A,3 代表 B,2 代表 C,1 則代表 D,0 則代表 F,權重則為學分數,習題 54即提供一個練習的例子。其他的加權平均數的例子中磅數、金額、及/或數量等等都常被用來當成權重。不管何種情況,只要觀察值的重要性是不相同的,分析人員就必須使用權重以反映每個觀察值在平均數中的重要性。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第115-116頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第116-117頁 群組資料 在大部分的案例中,位置與離散量數都是利用個 別資料計算而得。 有時僅有群組資料(grouped data)或是次數分配 形式的資料。 為了計算群組資料的平均數,我們視每組中點為 此分組所有數值的代表。 應用加權平均數的式(3.15) ,而且以Mi作為資料 值,次數fi作為權重。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第116-117頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第116.118頁 群組資料的平均數 群組資料的樣本平均數 群組資料的母體平均數 其中: fi = 第 i 組的次數 Mi = 第 i 組的組中點 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第116.118頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第117.118頁 群組資料的變異數 群組資料的樣本變異數 群組資料的母體變異數 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第117.118頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第116頁 表3.11 群組資料的實例 在2.2節中,我們做出Sanderson and Clifford會計事務所完成年度稽核時間(天)的次數分配,並以20家公司為樣本,做出稽核時間的次數分配如表3.11。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第116頁 表3.11

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第116-117頁 表3.12 群組資料的實例 五個分組的組中點與加權平均數的計算在表 3.12 中,如表所示,樣本平均稽核時間為 19 天。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第116-117頁 表3.12

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第117頁 表3.13 群組資料的實例 根據表 3.11 稽核時間的群組資料,將樣本變異數的計算過程列在表 3.13,計算結果可知樣本變異數為30。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第117頁 表3.13

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第117頁 群組資料的實例 群組資料的標準差即是變異數的平方根。以稽核時間而言,樣本標準差 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第117頁

第3章敘述統計II:數值方法 Part B (3.3~3.6) 第118頁 評註 在計算群組資料的敘述統計量時,組中點用來近似該分組的資料值,結果是群組資料的敘述統計量只會近似於直接使用原始資料所得到的敘述統計量。因此,我們建議儘可能從原始資料而不是群組資料來計算敘述統計量。 第3章敘述統計II:數值方法 Part B (3.3~3.6) 第118頁

End of Chapter 3, Part B