Keller: Stats for Mgmt & Econ, 7th Ed 圖表敘述法

Slides:



Advertisements
Similar presentations
如何為學生提供最大的選科組合 ? 方塊式時間表 (Block time-table) 學務主任羅偉南老師 聖文德書院.
Advertisements

公假系統使用規則. 1. 由校內同仁登入正修訊息網(公假系統權限僅開放全校教職員) 點選學務資訊 → 學務管理系統.
總務處勞健保業務說明 勞工保險相關規定 全民健康保險相關規定 勞工退休金相關規定 勞保、健保、勞退金 加保表說明 退保表說明 薪調表說明
第十三章 医学统计学方法的基本概念和基本步骤
Keller: Stats for Mgmt & Econ, 7th Ed 機率
第六章 统计表与统计图 第一节 统计表 第二节 统计图 1.
統計調查規劃設計 ~如何統計分析資料?~ 輔仁大學統計資訊系 謝邦昌 教授.
資料概說 1.1 基本名詞介紹 1.2 資料型態 1.3 基本操作 商管研究資料分析SPSS的應用 Chapter 1 資料概說.
1 Chapter 統計學緒論.
政府機關綠色採購申報系 統操作說明及問題疑義
105學年度第一學期 選課作業說明 教務處 課務組.
Measures of location and dispersion
第一章 生物统计学基本知识 1、明确统计在做什么事情、将用什么样的方式去做。 2、生物统计与统计学的关系,其涉及哪些内容 1.
第1章 统计学的基本概念 什么是统计学 基本概念.
生物醫學統計學.
“淡雅浓香 中国风尚” 山东低度浓香白酒整合传播侧记
商用統計學 Chapter 12 類別資料分析.
讀書心得分享: 善待細胞, 可以活的更好.
第 1 章 資料與統計.
統計學 郭信霖 許淑卿.
如何使用 Excel 與SPSS繪製 統計圖型
统计学Statistics 主讲人:商学院 刘后平 教授
耕地占用税、契税业务知识培训 耕 契 税 科.
第一章 统计学及其基本概念 南京财经大学统计学系.
医学统计学 主讲人:信息部 林雪君.
第一章.
Ch3 指數與對數 3-5 指數與對數的應用 影音錄製:陳清海老師 資料提供:龍騰文化事業股份有限公司.
初級統計學 陳信如.
第二章 SAS的描述统计功能 2.1 描述性统计的基本概念 2.2 在SAS中计算统计量 2.3 统计图形.
描述資料: 次數表, 次數分配, 以及 統計圖 第二章
3.2 Tally Table:將資料分成等距離的組別,再
Chapter 2 第二章 Presenting Data in Tables and Charts 統計圖及表的應用
EViews操作簡介 2013/11/06.
敘述統計-資料的特性 Properties of Variable
Chapter 2 頻率分配.
第一章 敘述統計學.
統計基本觀念 壹、資料 資料來源:實驗之量測結果,抽樣調查結果,公告資料。 一、資料類型
第八章 科研资料的整理与分析.
圖表製作 集中指標 0628 統計學.
第四章 品質管制七大手法.
第 2 章 敘述統計:表格與圖形法.
敍述統計學 許明宗.
The Nature and Scope of Econometrics
統計圖表繪製 何沛勝.
第一次上統計Tutorial 就上手 不是只有上一次嗎.
表達及陳列統計資料 統計圖表 統計量數 次數分配表 直方圖 次數多邊圖 累加次數圖 條形圖 圓形比例圖 集中量數 變異量數或離散量數
敘述統計I:表格與圖形法 Part A ( ) 第 2 章 敘述統計I:表格與圖形法 Part A ( )
第二版 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
學生:蕭允菡 巫胤漪 吳旻芬 許雅婷 黃鈺晴 藍珮文
生物統計 1 課程簡介 (Introduction)
问卷设计及数据分析初步 柯政
資料整理與次數分配 Organizing Data 社會統計(上) ©蘇國賢2000.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
資料整理與次數分配 Organizing Data 社會統計(上).
Keller: Stats for Mgmt & Econ, 7th Ed 抽樣分配
Keller: Stats for Mgmt&Econ, 7th Ed. 何謂統計學?
Chapter 1 統計學緒論. Chapter 1 統計學緒論 Study Report 講述一個神奇而美麗的統計 很多人或許常常在問:「What is Statistics」-統計是甚麼? 統計是製造可信賴的之資料,分析資料的真正意義。 有一列火車上有一位統計學家,一位物理學家和一位數學.
第二章 经典线性回归模型: 双变量线性回归模型
美國經濟大蕭條 4000S079 謝慧誼.
統計學簡介 許明宗.
资料的描述性分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2012/7/6.
医学统计学 (Medical Statistics)
單元2 範例介紹、資料型態與資料讀取 羅琪老師
第二章 資料之收集與展現 2.2 資料之收集 有兩種類型之資料: 原始資料:因研究所需而收集之資料,可
第二章 次數分配表與統計圖 第一節 次數分配表的製作 第二節 統計圖的製作 第三節 次數分配的形狀和性質 第四節 電腦習作.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
Statistical Table and Statistical Graph
地理資料 包含兩部分 地理位置 表明這個地理資料的位置在何處。地理資料為空間資料的一種,因此必須對空間中的位置加以標定 屬性
Presentation transcript:

Keller: Stats for Mgmt & Econ, 7th Ed 圖表敘述法 2017年3月8日星期三 第2章 圖表敘述法 Copyright © 2006 Brooks/Cole, a division of Thomson Learning, Inc.

導論 敘述統計(descriptive statistics) 涉及安排、彙總與呈現一組資料,以產生有用的資訊。 它的方法是使用圖表與數值敘述量數(如平均數) 來彙總與呈現資料。 統計 資料 資訊 第2章 圖表敘述法 第14頁

在此呈現的圖示法 & 表格法可應用於描述整個母體與從母體中所抽出的樣本 母體 & 樣本 在此呈現的圖示法 & 表格法可應用於描述整個母體與從母體中所抽出的樣本 母體 樣本 子集合 第2章 圖表敘述法

2.1 資料和資訊的類型 變數(variable) 是指一個母體或樣本的某些特性。 例如:統計學考試的成績。通常使用大寫的英文字母如X、Y 和Z 來表達變數的名稱。 變數的值(values) 是變數可能的觀測值。 例如:統計學考試成績的數值是介於0到100之 間的整數。 資料(data)是觀測到的變數值。 例如,我們觀察10 個學生期中考的成績,得到 如下的資料:{67, 74, 71, 83, 93, 55, 48, 82, 68, 62} 第2章 圖表敘述法 第15頁

2.1 資料和資訊的類型 資料的型態有三種: 區間資料 名目資料 順序資料 第2章 圖表敘述法 第15-16頁

區間資料 區間資料 區間 (interval)資料是實際的數字,諸如身高、體重、所得和距離之類。 我們也稱此類型的資料是屬量的(quantitative)或數值的(numerical)。 第2章 圖表敘述法 第15頁

名目資料 名目資料 名目(nominal)資料的值是類別。例如,我們使用下列編碼(codes)來記錄婚姻狀態: 單身 = 1,已婚 = 2,離婚 = 3,鰥寡 = 4 這些值並不是數字,而是描述類別的文字。 名目資料也被稱為是屬質的(qualitative) 或類別的 (categorical) 。 第2章 圖表敘述法 第15-16頁

順序資料 順序(ordinal) 資料 看起來像名目資料,但順序資料值的順序是有意義的。 例如,大多數的學院或大學在課程完成後,學生會被要求為該課程填寫考評。 不好 = 1,普通 = 2,良好 = 3, 很好 = 4,非常好 = 5 代表順序資料的編碼,除了依照順序外,是任意指定的。 第2章 圖表敘述法 第16頁

各種類型資料的計算 幾乎所有的計算都適用於區間資料。 因為名目資料的編碼是任意指定的,所以我們無法對這些編碼執行任何的計算。 順序資料最重要的一點就是資料值的順序。因此,唯一被許可的計算是涉及排序的處理過程。 資料類型的定義與層級整理如下。 第2章 圖表敘述法 I 第17-19頁

資料的階層 區間 資料值是實際的數字。 所有的運算皆有效。 資料可以被視為順序或名目資料來處理。 順序 資料值必須呈現資料的順序。 立基於排序過程的運算是有效的。 資料可以被當成名目資料但不可以被當成區間資料來處理。 名目 資料值是代表類別的任意數字。 唯有立基於發生次數或百分比的計算才是有效的。 資料不能被當成順序資料或區間資料來處理。 第2章 圖表敘述法 I 第19頁

2.2 一組名目資料的描述 唯一能夠對名目資料進行的運算是計算變數的每一個值所出現的次數或是計算其出現的百分比。 我們以一個表格來彙整資料,呈現變數的類別與計數,稱為次數分配(frequency distribution)。 相對次數分配(relative frequency distribution) 則是列出變數的類別以及它們會發生的比例。 第2章 圖表敘述法 第21頁

範例2.1 2012 年GSS 的工作狀況調查GSS2012* 在第1章中,我們簡要地介紹了一般社會調查。在2012年的調查中受訪者被問及下列的問題。 「上週你做的工作是全職、兼職、上學、家管,或是什麼?」回應如下: 1. 全職工作 5. 退休 2. 兼職工作 6. 上學 3. 暫時沒有上班 7. 家管 4. 失業,資遣 8. 其他 第2章 圖表敘述法 第21頁

範例2.1 2012 年GSS 的工作狀況調查 回應分別使用編碼1, 2, 3, 4, 5, 6, 7和8記錄著。前150 個觀測值在此列出。變數名稱為WRKSTAT(Work Status),而且資料被儲存在第25 欄 (Excel中的Y欄)。 對這些資料建構一個次數以及相對次數分配,並透過製作一個長條圖或圓形圖對資料做圖形的彙整。 第2章 圖表敘述法 第21頁

範例2.1 2012 年GSS 的工作狀況調查 第2章 圖表敘述法 第21頁

表2.1 範例2.1 的次數分配與相對次數分配 第2章 圖表敘述法 第22頁 表2.1

圖2.1 範例2.1 的長條圖 長條圖(bar chart)通常被用來呈現次數。 第2章 圖表敘述法 第22.23頁 圖2.1

圖2.2 範例2.1 的圓形圖 圓形圖(pie chart)用圖表示相對次數。 第2章 圖表敘述法 第22.24頁 圖2.2

範例2.2 美國在2012年的能源消耗 Xm02-02 表2.3列出2012年美國使用的各種來源之能源消耗總量(公佈的最新可用資料)。 為了更容易了解細節,表中以萬億英熱單位(BTUs) 表示熱能的測量值。 使用一個適當的圖示法說明這些數字。 第2章 圖表敘述法 第25頁

表2.3 2012 年美國能源消耗量以來源種類計 第2章 圖表敘述法 第25頁 表2.3

圖2.3 範例2.2 的圓形圖 第2章 圖表敘述法 第26頁 圖2.3

描述順序資料 順序資料沒有特定的圖示法。 因此,當我們要描述一組順序資料時,我們將資 料視為名目資料,並且使用本節描述的方法。 唯一的準則是,長條圖中的長條應該要按照編碼 數值安排成遞增(或遞減) 的類別順序。 在圓形圖中,典型的方式是將圓形切片以順時鐘 方向排列成遞增或遞減的類別順序。 第2章 圖表敘述法 第27-28頁 2.21

2.3 兩個名目變數間關係的描述與兩組或兩組以上名目資料集的比較 2.3 兩個名目變數間關係的描述與兩組或兩組以上名目資料集的比較 在2.2 節,我們曾提出使用圖形與表格方法來彙總一組名目資料。 交叉分類表(cross-classification table) 又稱為交叉表(cross-tabulation table) ,是用來描述兩個名目變數之間的關係。 一個交叉分類表列出兩個變數每一種數值組合的次數。 第2章 圖表敘述法 第29頁

範例2.4 閱報讀者的意見調查 在一個主要的北美城市中,有四種相互競爭的報紙:《環球郵報》(Globe and Mail, G&M)、《郵報》(Post)、《星報》(Star),與《太陽報》(Sun)。 為了促進廣告活動的設計,報社的廣告部經理需要知道哪個報紙市場的區隔是該報的讀者。 所以,執行一項分析閱報讀者與職業之間關係的調查。 第2章 圖表敘述法 第29頁

範例2.4 閱報讀者的意見調查 樣本中的每一位閱報讀者都被要求回答他們閱讀哪一家的報紙:《環球郵報》(1)、《郵報》(2)、《星報》(3)、《太陽報》(4),並且指出他們是否為藍領工作者(1)、白領工作者(2),或專業人士(3)。判斷兩個名目變數是否有關聯。 這些答覆使用編碼被儲存在Xm02-04裡。 第2章 圖表敘述法 第29頁

範例2.4 閱報讀者的意見調查 以計算12 種組合中每一組出現的次數,產生了表2.5。 第2章 圖表敘述法 第30頁 表2.5

範例2.4 閱報讀者的意見調查 如果職業與所閱讀的報紙是相關聯的,則各種職業間閱讀的報紙將存在著差異。一種簡單的方法是將每一列(或行) 的次數轉換成每一列(或行) 的相對次數。也就是,計算每一列(或行) 的總數,並將各個次數除以該列(或行) 的加總。 第2章 圖表敘述法 第30頁

表2.6 範例2.4的列相對次數 第2章 圖表敘述法 第30 表2.6

範例2.4 閱報讀者的意見調查 詮釋:注意到在第2列與第3列中的相對次數是相似的,而第1列與第2列和第3列之間則有很大的差異。 範例2.4 閱報讀者的意見調查 詮釋:注意到在第2列與第3列中的相對次數是相似的,而第1列與第2列和第3列之間則有很大的差異。 這告訴我們藍領工作者傾向於與白領工作者和專業人士閱讀不同的報紙,而白領工作者與專業人士在報紙的選擇上則比較相似。 不相似 相似 第2章 圖表敘述法 第30頁

範例2.4 閱報讀者的意見調查 第2章 圖表敘述法 第31頁 2.29

2.4 描述一組區間資料的圖示法 我們介紹幾種用在區間資料的圖示法。 這些方法中最重要的一種是直方圖(histogram)。 直方圖不僅是一種用以彙整區間資料的有效繪圖方法,而且有助於解說一些機率的重要性質(見第7章)。 第2章 圖表敘述法 第32頁

範例2.5 長途電話帳單的分析 隨著電話服務解禁之後,數家新公司成立以投入長途電話服務商場的競爭。由於每一家提供的服務都相當類似,幾乎所有的公司都在價格上競爭。面對劇烈的競爭,要為一項服務或產品訂定價格是非常困難的。需要考慮的因素包括供給、需求、價格彈性,與競爭者的各種行動。長途電話費率的組合方式可能採分鐘計費、每月基本費率,或是兩種方式的某種組合。要決定適當的費率結構,需獲得顧客行為的資訊,特別是每月長途電話費多寡的資訊。 第2章 圖表敘述法 第32-33頁

範例2.5 長途電話帳單的分析 做為一個大型研究的一部分,某長途電話公司想要獲得新客戶與公司簽約後第一個月的電話費資訊。這家公司的行銷經理對200位新客戶作調查,記錄他們第一個月的帳單。這些資料如Xm03-01所示。這位經理計畫將他的發現報告給資深總裁。從這些資料中能抽取出什麼樣的資訊? 第2章 圖表敘述法 第33頁

範例2.5 長途電話帳單的分析 在前面章節中,次數分配是以計算名目變數在每一個類別所發生的次數而建立的。對於區間資料的次數分配,我們則計算觀測值分別落在一系列區間內的次數,這些區間稱為類組(classes),它們涵蓋了觀測值完整的數值範圍。 我們稍後會討論如何決定類組的組數以及區間的上限(upper limits)與下限(lower limits)。 第2章 圖表敘述法 第33-34頁

範例2.5 長途電話帳單的分析 我們已選定了八個類組,它們是以每一個觀測值只落在一個且唯一的一個類組的原則下定義而成的。這些類組的定義如下: 範例2.5 長途電話帳單的分析 我們已選定了八個類組,它們是以每一個觀測值只落在一個且唯一的一個類組的原則下定義而成的。這些類組的定義如下: 類組 金額小於或等於15 金額大於15但小於或等於30 金額大於30但小於或等於45 金額大於45但小於或等於60 金額大於60但小於或等於75 金額大於75但小於或等於90 金額大於90但小於或等於105 金額大於105但小於或等於120 第2章 圖表敘述法 第34頁

圖2.5 範例2.5 的直方圖 第2章 圖表敘述法 第35頁 圖2.5

詮釋 帳單 大約半數的每月帳單金額 是很小的 較多的長途電話帳單金額落 在高額區段 少數帳單金額是在中間區段 第2章 圖表敘述法

建立一個直方圖 獲得資料 建立一個次數分配表 表2.8: 決定類組的組數 這個表告訴我們使用7, 8, 9, 10個類組。 另一種取代表2.8準則的方法是使用史特基公式(Sturges’s formula):類組區間的組數=1+3.3 log (n) 第2章 圖表敘述法 第36頁 表2.8

建立一個直方圖 獲得資料 建立一個次數分配表 a)決定類組的組數[8] b)區間的上限(upper limits) 與下限(lower limits) 範圍 = 最大觀測值 – 最小觀測值 範圍 = $119.63 – $0 = 119.63 類組寬度: 範圍 ÷ (# 組數) = 119.63 ÷ 8 ≈ 15 第2章 圖表敘述法 第36頁

建立一個直方圖 第2章 圖表敘述法 第34頁 表2.7

建立一個直方圖 第2章 圖表敘述法 第34-35頁 表2.7&圖2.5

直方圖的形狀 對稱性 一個直方圖被稱為是對稱的(symmetric)。如果我們從直方圖的正中央向下畫一條垂直線,兩邊的形狀和大小剛好是相同的。 第2章 圖表敘述法 第37頁 圖2.6

直方圖的形狀 偏斜 一個偏斜的直方圖是指一個有向右方或向左方延伸長尾的直方圖。 正偏 負偏 第2章 圖表敘述法 第37頁 圖2.7 2.42

直方圖的形狀 眾數類組的個數 一個單峰直方圖(unimodal histogram) 具有一個高峰,雙峰直方圖(bimodal historgram) 則具有兩個高峰。 雙峰 單峰 眾數組(modal class) 是一個含有最多觀測值的類組 第2章 圖表敘述法 第38頁 圖2.8&圖2.9

直方圖的形狀 鐘形 一種特別的對稱單峰直方圖是呈鐘形的。 次 數 變數 鐘形 第2章 圖表敘述法 第38頁

範例2.6 比較兩種投資的報酬率 假設你面臨一項投資決策,你有一筆小額財產,那是暑期工作所得再扣除明年預計花費之後的餘額。 一位朋友建議兩種投資,為助於做決定,你取得每種投資的一些報酬率。 你想要知道你期待的報酬是什麼外加一些其他類型的資訊,例如報酬率散佈的範圍是否很廣(使得投資具高風險),或是緊密地聚集在一起(表示風險相對地低)。 第2章 圖表敘述法 第39-40頁

範例2.6 比較兩種投資的報酬率 這些資料是否告訴你可能做得極好而幾乎不會有巨大的損失?你是否可能會虧損(負的報酬率)? 兩種投資的報酬率如Xm03-02所列。為每一組報酬 率畫出直方圖並報告你的發現。你將會選擇哪一種投資,為什麼? 第2章 圖表敘述法 第40頁

範例2.6 比較兩種投資的報酬率 第2章 圖表敘述法 第40頁

範例2.7 商業統計學成績 一位商業學程的學生目前正要修習他的第一門統計學必修課。這位學生有一點擔憂,因為聽說這是一門很困難的課。 為了緩和自己的焦慮,這位學生詢問教授這門課程去年的成績。這位教授答應了學生的要求並提供給他一份包含學期作業與期末考的最後總成績資料。 根據Xm03-03*的分數,畫一個直方圖並且描述其結 果。 第2章 圖表敘述法 第41頁

範例2.7 商業統計學成績 第2章 圖表敘述法 第42頁

範例2.8 數理統計學的成績 假設範例2.7中的這位學生得到一份去年數理統計課的成績清單。這門課強調公式的推導與理論的證明。 使用Xm03-04*的資料畫一個直方圖,並且將其與範例 3.3所得到的圖相比較。這個直方圖告訴你什麼訊 息? 第2章 圖表敘述法 第42頁

範例2.8 數理統計學的成績 第2章 圖表敘述法 第42頁

莖葉圖 直方圖的缺點之一是觀測值的分類造成我們損失一些潛在有用的資訊。 將每一個觀測值分成兩個部分,一個莖與一個葉。 例如,一個觀測值的數值是42.19。 分離莖與葉的方法有數種。 我們可以在小數點分離, 莖是由小數點左邊的數字所組成, 而葉則是小數點右邊的數字。 我們也可以在十位數的位置分離, 莖是十位數的數字,而葉是個位數的數字。 莖 葉 42 19 4 2 第2章 圖表敘述法 第43頁

莖葉圖 我們將使用這個定義為範例2.5建立一個莖葉圖。 莖 葉 0 0000000000111112222223333345555556666666778888999999 1 000001111233333334455555667889999 2 0000111112344666778999 3 001335589 4 124445589 5 33566 6 3458 7 022224556789 8 334457889999 9 00112222233344555999 10 001344446699 11 0124557889 我們仍能看到實際的觀測值。 第23章 圖表敘述法 第44頁 圖2.11

肩形圖 肩形圖(ogive)是累積相對次數(cumulative relative frequency)的圖形表示。 用各組次數除以總觀測值個數來建立一個相對次數分配(relative frequency distribution): 相對次數 = 各組次數 觀測值個數 第2章 圖表敘述法 第44-45頁

肩形圖 肩形圖是累積相對次數的圖形表示。 1)建立一個相對次數分配。  2)建立一個累積相對次數分配。  3)手繪肩形圖。 1)建立一個相對次數分配。  2)建立一個累積相對次數分配。  3)手繪肩形圖。 第2章 圖表敘述法 第44-45頁 圖2.12

圖3.9 範例3.1 的肩形圖與估計的相對次數 第3章 圖表敘述法 II 第59頁 圖3.9

圖2.13 範例2.5 的肩形圖與估計的相對次數 第2章 圖表敘述法 第46頁 圖2.13

2.5 時間序列資料的描述 在同一時間被測量的觀測值,稱為橫斷面資料(cross-sectional data)。 在一連續時間點被測量的觀測值,稱為時間序列資料(time-series data)。 時間序列通常以線圖(line chart) 來描述,它是對變數在不同時間點的值所繪的圖。它的建立是將變數的值畫在垂直軸上而將不同的時間點畫在水平軸上。 第2章 圖表敘述法 第48頁

範例2.9 汽油的價格 我們記錄了1976 年1月以來汽油的每月平均零售價(以每加侖幾分計)。 資料如Xm03-05所示。畫一個線圖以描述這些資料,並且簡短地說明其結果。 第2章 圖表敘述法 第49頁

範例2.9 的線圖 第2章 圖表敘述法 第50頁

2.6 兩個區間變數間關係的描述 統計實作人員經常需要知道兩個區間變數是如何相關聯的。 探討這種關係,我們採用散佈圖(scatter diagram)。 在應用上,一個變數在某種程度上會依賴另一個變數,我們標示它為依變數Y,另一個則稱為獨立變數,標示為X。 第2章 圖表敘述法 第52頁

範例2.10 分析房屋售價與房屋大小間的關係 一位不動產經紀人想要知道銷售一棟房屋的售價與房屋大小之間的關聯程度。為了獲得這項資訊,他抽取12戶最近售出的房屋樣本,記錄了售價(以千美元計) 以及房屋大小(以平方呎)。資料列在Xm03-07中。使用圖示法說明房屋大小和售價之間的關係。 第3章 圖表敘述法 II 第69頁

圖2.14 範例2.10 的散佈圖 散佈圖顯示,一般而言,房屋越大其售價越高。 第2章 圖表敘述法 第53頁

散佈圖的型態 兩個最重要的特性是線性關係的強度與方向。 正向的線性關係 負向的線性關係 無關係或非線性的關係 第2章 圖表敘述法

2.7 圖表的藝術與科學 當統計的圖形具下列的特質,則此圖形可稱為優質圖形。 統計圖形能夠簡潔地,並清楚且連貫地呈現大筆的資料。 2.7 圖表的藝術與科學 當統計的圖形具下列的特質,則此圖形可稱為優質圖形。 統計圖形能夠簡潔地,並清楚且連貫地呈現大筆的資料。 讀者能夠明確地了解統計實作人員想要傳達的思想與概念。 統計圖形能夠鼓勵讀者比較兩個或兩個以上的變數。 統計圖形能夠誘導讀者專注於資料的內容而不是圖表的外觀。 並無扭曲資料所顯示的訊息。 第2章 圖表敘述法 第56-57頁

2.7 圖表的藝術與科學 耶魯大學的統計學教授Edward Tufte,針對優質的統計圖做如下的彙總: 2.7 圖表的藝術與科學 耶魯大學的統計學教授Edward Tufte,針對優質的統計圖做如下的彙總: 優質圖形是以良好的設計方式呈現感興趣的資料──是一種本質的、統計的與設計的資料呈現方式。 優質圖形是在最少的筆墨空間下以最短的時間傳達最多的統計理念給讀者。 優質圖形幾乎都是多變量的。 優質圖形必須傳達資料的真相。 第2章 圖表敘述法 第57頁

3.4 圖表的藝術與科學 圖2.17 顯示Minard所製作的時間序列圖被認為是史上最好的圖表之一。 因為它明確簡潔地說明 5 個變數。 3.4 圖表的藝術與科學 圖2.17 顯示Minard所製作的時間序列圖被認為是史上最好的圖表之一。 因為它明確簡潔地說明 5 個變數。 第2章 圖表敘述法 第57頁

圖2.17 描繪拿破崙的入侵和1812 年從俄國撤退的圖 第2章 圖表敘述法 第58頁 圖2.17

圖形的欺瞞性 精確地評估圖示法所呈現的資訊將會比以往更重要。 在最後的分析中,圖示法不僅產生視覺上的印象, 而且它也容易被扭曲。事實上,扭曲的圖表是容易 產生的。 首先要留意的是任何一個軸上沒有顯示刻度的圖表。 第二種須避免的陷阱是被圖表的標題所影響。 特別注意因圖形大小所造成的扭曲誤導。 第2章 圖表敘述法 第58-62頁

圖2.18 沒有刻度的圖示 圖2.18 是一個公司銷售的線圖,它可能代表五年以來100%或1%的成長率,依垂直軸的刻度而定。對於這一類的圖,最好的方式的就是忽略它們。 第2章 圖表敘述法 第59頁 圖2.18

圖2.19 有著不同標題的圖示 你對利率變動的印象可能依你讀到的是報紙所刊載的標題(a) 或標題(b)而有不同的印象,見圖2.19。 如果報告中僅純粹呈現改變的數值大小,而不是改變的百分比,則觀點經常會被扭曲。價格$2的股票下滑$1,相對的比$100的股票下滑$1更令人沮喪。 第2章 圖表敘述法 第59頁 圖2.19

圖2.20 顯示道瓊工業指數下降的圖示 在1986年1月9日,北美全部的報紙顯示類似圖3.16 的統計圖,並且報告由道瓊工業指數(DJIA)評估的股市,遭遇前所未有單日最大的跌幅。 第2章 圖表敘述法 第60頁 圖2.20

圖形的欺瞞性 當日爆跌39點,甚至超過黑色星期二——1929年10 月28日的跌幅。當時的跌幅確實是很大,但是許多報紙的報導卻沒有提到1986年的道瓊工業指數遠高於1929年的水準。此種狀況下比較客觀的公告是1986年1月8日的下降代表2.5%的下跌,而1929年的下跌是12.8%。有趣的是,我們注意到在這歷史性下跌的2個月之內股價上揚了12%,並且在一年之後上揚了40%。史上曾有一天之內最大的跌幅是24.4%,發生於1914年12月12日。 第2章 圖表敘述法 第59頁

圖形的欺瞞性 圖2.21描述某個公司去年從1億美元成長到1.1億美元的季銷售情況。這10%季銷售的成長可以使用延伸縱軸的方式,使圖看起來更具戲劇性的效果——一種方法涉及變更縱軸刻度的方法,使得金額可以呈現出比以前更大的高度。因為圖的斜率看起來(但不是數值化的)變得更陡,導致銷售成長幅度顯得更大。 第2章 圖表敘述法 第60頁

圖2.21 顯示季銷售成長的圖形 1 第2章 圖表敘述法 第60頁 圖2.21

圖形的欺瞞性 刻度的延伸可以藉由在縱軸使用一個中斷線來達成,如圖2.22(a),或是截短縱軸,如圖2.22(b),使得縱軸的刻度起始於一個大於 0 的點。也可以藉著縮短橫軸的方式以製造斜率看起來更陡的效果,在這種情況下,橫軸上各點的距離會移得更近。 第2章 圖表敘述法 第60頁

圖2.22 顯示季銷售成長的圖形 2 第2章 圖表敘述法 第61頁 圖2.22

圖形的欺瞞性 圖2.23(a)呈現某公司的利潤圖,從一季到下一季的利潤,向上與向下兩種起伏都呈現很大的波動。但是,藉著延長橫軸的技巧,如圖2.23(b)所示,這家公司可傳遞季與季之間的利潤是合理穩定的印象。 第2章 圖表敘述法 第60頁

圖2.23 顯示很大波動或相對穩定的圖形 第2章 圖表敘述法 第61頁 圖2.23

圖形的欺瞞性 圖2.24(a)中的長條圖正確地描述加拿大家庭在三個特定的年份中每週食物的平均花費。這個圖正確地使用等寬的長條,使得每一長條的高度與面積及其所表示的花費成比例。在圖2.24(b)中誇大了食物費用成長的狀況,其中每一長條的寬度隨著高度一起增加。快速瞄過此長條圖時,讀者可能會留下十年間食物費用增加四倍的錯誤印象,因為1995年的長條大小是1985年的四倍。 第2章 圖表敘述法 第61頁

圖2.24 正確和扭曲的長條圖 第2章 圖表敘述法 第61頁 圖2.24

圖2.25 圖案型統計圖形的誤用 圖2.25 呈現圖案型統計圖形的誤用——代表降雪量的雪人不僅增寬也增高。 圖2.25 圖案型統計圖形的誤用 圖2.25 呈現圖案型統計圖形的誤用——代表降雪量的雪人不僅增寬也增高。 第2章 圖表敘述法 第62頁 圖2.25

圖2.26 正確的圖案型統計圖形 圖2.26呈現適當使用的圖案型統計圖形,它有效地使用可口可樂瓶子的圖像。 圖2.26 正確的圖案型統計圖形 圖2.26呈現適當使用的圖案型統計圖形,它有效地使用可口可樂瓶子的圖像。 第2章 圖表敘述法 第62頁 圖2.26

本章摘要 敘述性統計方法是用來彙整資料,使得我們能夠擷取相關的資訊。在本章中我們呈現了名目資料的圖表。 長條圖、圓形圖和次數分配是用來彙整單一的名目資料集。因為應用這種類型資料的限制,我們只能呈現每一個類組的次數或比例。 為了描述兩個名目變數之間的關係,我們繪製交叉分類表和長條圖。 第2章 圖表敘述法 第63頁 2.84

本章摘要 直方圖被用來描述單一的區間資料集。統計實作人員檢視直方圖的各種形狀特徵。包括對稱性、眾數的個數,以及圖形本身是否近似於鐘形。 我們描述時間序列資料和橫斷面資料之間的差異。時間序列是以線圖呈現。 為了分析兩個區間變數的關係,我們繪製散佈圖,以尋找線性關係的方向和強度。 第2章 圖表敘述法 第63頁