Download presentation
Presentation is loading. Please wait.
1
商用統計學 Chapter 3 敘述統計(二) – 統計量數
2
敍述統計(二) – 統計量數 我們在第一章曾說明,如就敘述統計學言,主要有三部份,分別 是:蒐集、整理與分析資料,前二項已在第二章說明,本章將說 明“分析”資料之部份。
3
敍述統計(二) – 統計量數 統計資料雖已經過蒐集與整理,但未必能完全符合研究者所需, 因此常需要進一步分析,以瞭解統計資料的特徵。常見的分析方 法,是計算統計量數,包括集中量數、差異量數、偏態係數與峰 態係數等四種。
4
3-1統計量數概論 一般而言,常見的統計量數有四,這四個統計量數,已足以說明 一群資料的特徵:
5
3-2未分組資料集中量數之計算 統計資料的分析呈現,一般有針對“未分組資料 ( 原始資料 )” 與“已分組資料 ( 次級資料 )”兩種方式來求算,因此針對本章 統計量數的計算,亦分為這兩種形態加以說明。
6
3-2未分組資料集中量數之計算 集中量數包括平均數、中位數與眾數等三種,如下表所示:
7
3-2未分組資料集中量數之計算 . . .平均數 所謂平均數 (Means or Average),是指一群數值之代表值。我們 若依其計算方式之不同,而區分其種類,常見有下列三種:
8
3-2未分組資料集中量數之計算 . . .平均數 所謂算術平均數 (Arithmetic Mean),是指將一群資料的數值相 加,除以數值總個數而得之商,通稱為平均數。因為其易於計算 及了解,故用途最廣。 設有一群資料,分別為 ,則算術平均數之公式為: 1.母體資料 ( 以 ( 讀為mu) 表示母體平均數;個數以大N表示): 2. 樣本資料 ( 以 ( 讀為X bar) 表示樣本平均數;個數以小n表示 ):
9
例題一 聯電公司總共有六個專利權,其價值估計如下 ( 母體資料,單 位:億 ):試計算其專利權的平均價值。
5.6, 4.8, 12.0, 15.5, 3.8, 2.6 *解
10
例題二 甲商店近五天營業額資料 ( 樣本資料,單位:萬 ) 如下,試計 算其平均營業額。 80, 55, 70, 65, 45 *解
11
3-2未分組資料集中量數之計算 . . .平均數 由於一群資料中的各個數值,其重要性可能不同,因此常需要按重 要性程度的大小,使用不同權數,以表達資料個別值重要性之差 異。在計算平均數時,若將權數併入計算,即為加權平均數 (Weighted Mean)。 設有一群資料,分別為,其權數分別為 ,則加權平均數為:
12
3-2未分組資料集中量數之計算 . . .平均數 1.母體資料: 2.樣本資料:
13
例題三 晶元公司薪資結構表如下: 茲以上表求算 (1) 簡單平均薪資 ( 不考慮加級 )。 (2) 加權平均薪資 ( 考慮加級 )。 職 稱
職 稱 薪 資 加 級 組 長 16,000 1.2 主 任 23,000 1.5 經 理 32,000 2.0 副總經理 42,500 2.5 總 經 理 55,000 3.5
14
例題三 *解 (1) 簡單平均薪資 ( 不考慮加級 )。 (2) 加權平均薪資 ( 考慮加級 ):
15
例題四 第5年鴻福公司的最適目標資本結構為負債50% ( 負債稅後成本為
8%),20% 的特別股 ( 特別股成本6%),30% 的普通股權益 ( 普通 股權益成本5%),試求鴻福公司第5年加權平均資金成本。 *解 加權平均資金成本
16
3-2未分組資料集中量數之計算 . . .平均數 算術平均數具有下列性質: 1.各變量與其算術平均數之差的代數和等於零,即 註:母體資料亦同。 2.設有K組變量,其個數分別為,其算術平均數分別為,則全體平 均數為為
17
3-2未分組資料集中量數之計算 . . .平均數 3. 算術平均數有一缺點,是由於其考慮所有變量,其中有幾個數 值可能特別大或特別小 ( 稱為極端值,Extreme Value),因而 減弱平均數的代表性。若如此,可使用修正平均數 (Trimmed Mean) 計算 ( 資料前5% 與後5% 不計入 )。
18
3-2未分組資料集中量數之計算 . . .平均數 4.設a、b為常數,原數列變數為X,則下列式子成立: (1) 若 ,則 註: (2) 若 ,則 (3) 若 ,則 (2) 若 ,則 註:母體資料亦同。
19
例題五 試計算以下樣本資料平均值:1, 3, 5, 7, 9,並驗證 *解 (1) (2)
20
例題六 蘋果總共100個,分別裝於A、B、C與D四箱,其資料如下表所示: 試由上述分箱資料,求算100個蘋果的平均重量。 箱 別 個 數
箱 別 個 數 平均重量 ( 公克 ) A箱 18 38.7 B箱 35 45.0 C箱 30 33.5 D箱 17 42.8
21
例題六 *解
22
例題七 試求下列樣本資料之算術平均數。 1, 10, 12, 18, 20, 25, 15, 23, 14, 100 *解
由於1與100屬極端值 ( 在本資料中,顯得特別小或特別 大 ),可使用修正平均數,將1與100去除 ( ( 進 位取值 ),資料前後各一個 )。 (2) 修正平均數
23
3-2未分組資料集中量數之計算 . . .平均數 所謂幾何平均數 (Geometric Mean),是指n個數值連乘積的n次方 根。適合於幾何級數資料 ( 等比資料 ) 或以百分比表示的資料之 求平均。 設有一群資料,分別為 ,則幾何平均數G之公式為: 1.母體資料 2.樣本資料
24
例題八 世平公司最近四年之營業額為2, 4, 8, 16 ( 億元 ),試求其每年 平均營業額。 *解
因該資料成幾何級數 ( 即等比級數 ),所以用幾何平均數求之。 (2)
25
例題九 張三第1年投資台塑股票每股市價100元,第1年底台塑股票每股市 價120元,而第2年底台塑股票每股市價100元,試求張三兩年度投
資台塑股票的總報率與平均每年報酬率。 *解 (1)兩年度總報率: 第1年報酬率 第2年報酬率 兩年度總報酬率
26
例題九 (2)平均每年報酬率 (A) 算術平均數 (B) 幾何平均數 由於第1年漲20元,第2年跌20元,因此張三持有兩年的報酬率為
100% ( 表示無變動不賺不賠,若以算術平均數計算,上漲 1.67% ),以幾何平均數計算的結果比算術平均數計算的結果較為 精確。
27
例題九 註:(A) 因該資料以百分比表示,所以用幾何平均數求算。 (B) 由於報酬率計算是以100% 為比較基準,故上漲20%,須以
120% 表示,下跌16.67%,須以83.33% 表示 (100%- 16.67%),可免負數產生。
28
3-2未分組資料集中量數之計算 . . .中位數及其他分位數. . . . . . . . . . . . . . . . . . . . . . . . . .
分位數可分為兩大類:一為中位數,另一為其他分位數 ( 包括四 分位數、十分位數與百分位數 ),如下表所示:
29
3-2未分組資料集中量數之計算 . . .中位數及其他分位數. . . . . . . . . . . . . . . . . . . . . . . . . .
所謂中位數 (Median; Me),是指將一群資料的數值按大小順序排 列 ( 從小到大 ),其位置居中的一個數值,稱之。 設一群資料有n個變量,由小到大排列,則中位數為 1.n為奇數時,中位數在第 項之數值。 2.n為偶數時,中位數在第 項與 項之算術平均數。
30
例題十 (1) 求數值資料:7, 6, 3, 8, 2, 10, 15, 16, 18之中位數。 求數值資料:7, 6, 3, 8, 2, 10, 15, 16之中位數。 *解 (1) 先排列順序 ( 從小到大 ) 2, 3, 6, 7, 8, 10, 15, 16, 18 由於是奇數個 ,所以中位數位於第 項之位置,所以中位數 。 (2) 先排列順序 ( 從小到大 ) 2, 3, 6, 7, 8, 10, 15, 16 由於是偶數個 ,所以中位數位於第 項與 項之算術平均數的位置,第4項為7,第5項為8,故中位數
31
例題十
32
3-2未分組資料集中量數之計算 . . .中位數及其他分位數. . . . . . . . . . . . . . . . . . . . . . . . . .
中位數具有下列性質: 1. 中位數與其他變量之差的絕對值最小,即 。 2. 分割兩半:中位數將一群次數資料分為兩半,較中位數小的次 數有一半,較中位數大的次數則屬另一半。 3. 不受極端值的影響:中位數是位居中位的一個數值,不受極端 值的影響,故若資料有極端值出現,則中位數比算術平均數具 代表性。
33
3-2未分組資料集中量數之計算 . . .中位數及其他分位數. . . . . . . . . . . . . . . . . . . . . . . . . .
我們可利用中位數的概念,求算其他分位數。常見的有四分位數、 十分位數、百分位數。 四分位數 (Quartiles),即將一群資料分割成四個部分 ( 各百分 之二十五 ),從最小的一端起算,第一分割點之數稱為第一個四分 位數 ;第二分割點之數稱為第二個四分位數 ( ,即 ),第三分割點 之數稱為第三個四分位數。 四分位數的計算方式如下:
34
3-2未分組資料集中量數之計算 . . .中位數及其他分位數. . . . . . . . . . . . . . . . . . . . . . . . . .
(1) 先將n個變量從小到大順序排列。 (2) 從最小的一端起算。 (A) 在第 項之數值。 (B) 在第 項之數值。 (C) 在第 項之數值。
35
例題十一 求下列9種股票本益比之。 40, 42, 58, 56, 55, 74, 75, 70, 60 *解 (1) 先按大小順序排列。
40, 42, 55, 56, 58, 60, 70, 74, 75 (2) 在第 項。 ∴ 註:0.75項即佔42到55之距離的75%。 (3) 在第 項∴ 。
36
例題十一 在第 項。 ∴
37
例題十一 註:另解:亦有統計學書籍,以下列方式求解 ( 四分位數及以下 十分位數及百分位數亦同 )。 (1) 先將n個變量從小到大順序排列。
(2) 從最小的一端起算。 (A) 先求四分位數 之所在項數,設為 。 (B) 若i為非整數,則 為下一個整數之數值 ( 一律進 位 )。 (C) 若i為整數,則 為第i項與第 項之算術平均數。 茲舉一例說明之。 求40, 42, 56, 55, 58, 70, 60, 75, 74, 80之 。
38
例題十一 【解】 (1) 先按大小順序排列 40, 42, 55, 56, 58, 60, 70, 74, 75, 80 (2) 在第 項 項,非整數則一律進位,取第3項。 ∴ (3) 在第 項,整數則取第5項與第6項之算術平均數。 在第 項 項,非整數則一律進位,取第8項
39
3-2未分組資料集中量數之計算 . . .中位數及其他分位數. . . . . . . . . . . . . . . . . . . . . . . . . .
同理,十分位數 (Deciles),是指將一群資料分割成十個等分,其 分割點稱之。而百分位數 (Percentile),是指將一群資料分成100 個等分,其分割點稱之。 十分位數及百分位數之計算方式如下: 先將n個變量從小到大順序排列。
40
3-2未分組資料集中量數之計算 . . .中位數及其他分位數. . . . . . . . . . . . . . . . . . . . . . . . . .
同理,十分位數 (Deciles),是指將一群資料分割成十個等分,其 分割點稱之。而百分位數 (Percentile),是指將一群資料分成100 個等分,其分割點稱之。 十分位數及百分位數之計算方式如下: 先將n個變量從小到大順序排列。
41
3-2未分組資料集中量數之計算 . . .中位數及其他分位數. . . . . . . . . . . . . . . . . .
(1) 十分位數 ( 以 表示 )。 從最小的一端起算。 (A) 在第 項之數值。 (B) 在第 項之數值。 ………… (C) 在第 項之數值。 即第r個十分位數 在第 項之數值。
42
3-2未分組資料集中量數之計算 . . .中位數及其他分位數. . . . . . . . . . . . . . . . . .
百分位數 ( 以 表示 )。 (A) 在第 項之數值。 (B) 在第 項之數值。 ………… (C) 在第 項之數值。 即第r個百分位數 在第 項之數值。
43
例題十二 承上題【例題11】 (1) 第3個「十分位數」 。 (2) 第60個「百分位數」 。 (3) 第88個「百分位數」 。
44
例題十二 *解 (1) 先按大小順序排列。 40, 42, 55, 56, 58, 60, 70, 74, 75 (2) 在第 項。 ∴
(1) 先按大小順序排列。 40, 42, 55, 56, 58, 60, 70, 74, 75 (2) 在第 項。 ∴ (3) 第 項。 第 項。
45
例題十二 註:另解方法之答案 : ; ;,請讀者自算。
46
3-2未分組資料集中量數之計算 . . .中位數及其他分位數. . . . . . . . . . . . . . . . . . . . . . . . . .
所謂眾數 (Mode; Mo),是指一群資料中出現最多次數之數值,稱 之。若有兩個數值均為出現次數最多,如相鄰,則取其算術平均 數;如不相鄰,則有兩個眾數 ( 雙峰分配 )。若每個數值均出現 一次數,則沒有眾數。
47
例題十三 (1) 試求1, 4, 4, 6, 6, 6, 7, 7, 9之眾數。 (2) 試求1, 5, 5, 8, 8, 9, 10之眾數。 (3) 試求1, 5, 5, 7, 8, 8, 9, 10之眾數。 (4) 試求5, 6, 7, 1, 3, 4, 8之眾數。
48
例題十三 *解 (1) ( 有一眾數,為單峰分配 )。
49
例題十三 。 (3) 與8 ( 不相鄰,有二眾數,為雙峰分配 )。 (4) 數值各只出現一次,所以沒有眾數。
50
例題十四 求下表之眾數。 寶健運動飲料銷售地點數量表 單位:罐 資料來源:統一公司營業報告。 *解
表中便利超商750罐次數最多,∴ “便利超商”為眾數。 通 路 罐 數 便利超商 750 超 市 230 雜 貨 店 158 販 賣 機 120 其他地點 272 合 計 1,530
51
3-3分組資料集中量數之計算 . . .分組資料算術平均數 . . . . . . . . . . . . . . . .
3-3分組資料集中量數之計算 . . .分組資料算術平均數 分組資料算術平均數的計算方式如下: 1. 母體資料: 2. 樣本資料: 其中 第i組的組中點 N ( 或n) 總次數 第i組的次數 組數
52
例題十五 乙產品部份生產數量如下表所示,若重新裝箱,試求每箱平均個 數。 產品生產數量統計表 資料來源:營業報告。 個 數 箱數 (f)
個 數 箱數 (f) 10~20 8 20~30 12 30~40 35 40~50 20 50~60 25 合 計 100
53
例題十五 *解 (1) ( 個 / 箱 ) 個 數 箱數 (f) 組中點X fX 10~20 8 15 120 20~30 12 25
個 數 箱數 (f) 組中點X fX 10~20 8 15 120 20~30 12 25 300 30~40 35 1,225 40~50 20 45 900 50~60 55 1,375 合 計 100 3,920
54
例題十五
55
3-3分組資料集中量數之計算 . . .分組資料分位數 由於中位數、四分位數、十分位數、百分位數均是屬分位數的內 容,因此一併說明,並以百分位數的計算方式,來涵蓋其他分位數 的計算方式。 分組資料分位數的計算,有一個假設,就是每組內的數值,均勻分 佈於該組內,例如52, 56, 56, 58四數是均勻分佈於50~60這一組 內。因此其計算可用插補法的方式算出。
56
3-3分組資料集中量數之計算 分組資料分位數 其中 第r個百分位數 所在組之下限 組中點小於 之各組次數之總和 所在組之次數 所在組之組距 在代入上項公式之前,先要確定百分位數在數列中的項數,即 在第 項 ( 先計算次數之以下累積 ),並確定 在那一組。
57
例題十六 試就上例【例題15】求算 。 乙產品生產數量統計表 資料來源:營業報告。 個 數 箱數 (f) 10~20 8 20~30 12
試就上例【例題15】求算 。 乙產品生產數量統計表 資料來源:營業報告。 個 數 箱數 (f) 10~20 8 20~30 12 30~40 35 40~50 20 50~60 25 合 計 100
58
例題十六 *解 個 數 箱數 (f) 以下累積 10~20 8 20~30 12 20 30~40 35 55 40~50 75 50~60
個 數 箱數 (f) 以下累積 10~20 8 20~30 12 20 30~40 35 55 40~50 75 50~60 25 100 合 計
59
例題十六 *解 (1) 公式解: (A) 求算 。 先確定 ,在第 項,屬第3組內。 註:第3組30~40:以下累積到第55項。
60
例題十六 (B) 求算Me。 先確定 ,在第 項,屬第3組內。 註:第3組30~40:以下累積到第55項。
61
例題十六 (C) 求算 。 先確定 ,在第 項,屬第4組內。 註:第4組40~50:以下累積到第75項。
62
例題十六 (D) 求算 。 先確定 ,在第 項,屬第5組內。 註:第5組50~60:以下累積到第100項。
63
例題十六 (2) 插補法: (A) 由公式解與插補法計算可知,兩者相同。在前面我們曾說明,
分組資料計算分位數是假設每組內的資料是均勻分佈的,所以 計算方式可由插補法求算,這也是公式解的由來 ( 至於Me, 之插補法計算,請讀者自解 )。
64
3-3分組資料集中量數之計算 . . .分組資料眾數 分組資料之眾數有許多求法,本節只介紹統計學家皮爾生 (K. Pearson) 所提出的觀點。 根據統計學家皮爾生多年研究發現,單峰微偏的次數分配中,算術 平均數,中位數與眾數三者有一甚為穩定的關係,如下所示 ( 茲 以樣本平均數 說明,母體平均數 亦同 ): 換句話說, 與Mo的距離是 與Me距離的3倍。 在單峰分配上,同一資料所求得的 、Mo與Me之關係如下: 1.
65
3-3分組資料集中量數之計算 . . .分組資料眾數 2. 單峰對稱分配: ( 完全對稱分配 ),如下圖所示: 3. 單峰右偏分配: ( 單峰在左,長尾在右 ),如下圖所示:
66
3-3分組資料集中量數之計算 . . .分組資料眾數 4. 單峰左偏分配: ( 單峰在右,長尾在左 ),如下圖所示:
67
例題十七 根據某統計資料計算出 ,試以皮爾生法求算眾數,並判斷其分配形態。 *解 (1) ∵ ,∴為單峰右偏分配。 (3)如下圖所示:
68
例題十八 一項股票型基金近5年之績效如下 ( 單位:% ): (1) 甲股票型基金:50, 50, 50, 50, 50。
(2) 乙股票型基金:10, 90, 20, 80, 50。 試以平均數與差異量數的觀點,討論甲乙股票型基金的意義。 *解 先計算平均數: 甲股票型基金平均績效 (2) 乙股票型基金平均績效 兩股票型基金平均績效相同。但我們從原始資料觀察,甲股票 型基金平均績效均為50%,毫無差異 ( 風險程度一樣,平均績 效代表性強 ),但乙股票型基金平均績效差異甚大 ( 有10%, 有90%,風險差異很大,平均績效代表性弱 )。由此我們可 知,要了解統計資料的特徵,除了了解平均數外,差異量數的 測定,亦為重要。否則平均數的代表性強弱無法獲知。
69
3-5未分組資料差異量數之計算 我們若依差異量數求算方式之不同,常見的差異量數,有下列四 種:
70
3-5未分組資料差異量數之計算 . . .全距 所謂全距 (Range; R),是指一群資料中的最大值與最小值之差的 量數,是最簡單的一種差異量數。 全距 (R) 之計算方式,如下所示: 其中 一群數值中之最大值 一群數值中之最小值
71
例題十九 六家賣場某天營業額為55, 70, 78, 40, 90, 60萬,求全距。 *解 ( 萬 )
72
3-5未分組資料差異量數之計算 . . .四分位差 所謂四分位差 (Quartile Deviation; Q.D.),是指第三個四分位 數 與第一個四分位數之差的一半之量數。因其由四分位數求算 而得,因此稱之為四分位差。其分子 ,稱為四分位距 (Interquartile Range; IQR)。 由以上之定義可知,四分位差 (Q.D.) 的計算方式為: ( 四分位距 ) ( 四分位差 )
73
例題二十 十家賣場某天營業額 ( 單位:萬 ) 為 12, 18, 16, 20, 21, 33, 35, 31, 45, 40 試求
(1) 四分位距。 (2) 四分位差。
74
例題二十 *解 (1) 先按大小順序排列。 12, 16, 18, 20, 21, 31, 33, 35, 40, 45 (2) 在第 項, ∴ 。 (3) 在第 項,∴ 。 (4) 四分位距 (IQR) 。 (5) 四分位差 (Q.D.) 。
75
例題二十
76
3-5未分組資料差異量數之計算 . . .平均差 所謂平均差 (Mean Deviation; M.D.),是指一群資料中各數值與 其算術平均數之差的絕對值之算術平均數。 由以上平均差之定義可知,平均差 (M.D.) 的計算方式為: 1. 母體資料: 2. 樣本資料:
77
例題二十一 遠東百貨公司抽查旗下六家超市某天營業額 ( 單位:萬 ): 22, 25, 30, 35, 40, 28 試求平均差。 *解
(1) ( 萬 ) (2)
78
3-5未分組資料差異量數之計算 . . .標準差 標準差的意義,一般都由標準差本身的公式界定。 所謂標準差 (Standard Deviation),是指一群資料之各數值與其 算術平均數差的平方之算術平均數的平方根。 標準差通常以 ( 讀為sigma) 表示之。若將標準差給予平方,以 表示,則稱為變異數 (Variance)。
79
3-5未分組資料差異量數之計算 . . .標準差 由標準差的定義可知,標準差 及變異數 的計算方式為: 1. 母體資料: 標準差: 變異數: 2. 樣本資料:
80
例題二十二 界揚超商共有六家門市,某天營業額 ( 單位:萬 ) 資料如下: 22, 25, 30, 35, 40, 28
試求標準差與變異數。 *解 ∵ 共有六家門市,∴ 為母體資料。 ( 萬 )。 (3) 母體標準差 (4) 母體變異數
81
例題二十三 遠東百貨公司抽出六家超市調查某一天營業額 ( 單位:萬 ) 如下: 22, 25, 30, 35, 40, 28
試求標準差與變異數。
82
例題二十三 *解 (1) ∵ 抽出六家超市調查,∴ 為樣本資料。 ( 萬 )。 (3) 樣本標準差 (4) 樣本變異數 。
83
例題二十三
84
3-6分組資料差異量數之計算 我們在上節是說明未分組資料差異量數的計算方式,本節將彙總說 明已分組資料差異量數之計算。 1.分組資料全距:乃以最大組的上限減除最小組的下限,即可得分 組資料之全距。 2.分組資料四分位距與四分位差:分組資料的四分位距與四分位之 計算公式,與未分組資料相同。
85
例題二十四 甲產品生產數量統計表 資料來源:營業報告。 試依上表 ( 設為母體資料 ) 求算 (1) 全距。 (2) 四分位距。
(3) 四分位差。 個 數 箱 數 10~20 8 20~30 12 30~40 35 40~50 20 50~60 25 合 計 100
86
例題二十四 *解 (1) (2) 四分位距: 先求算 與 (A) (B) (C)分位距 (IQR) (3) 四分位差 (Q.D)
87
例題二十四
88
例題二十五 承上題【例題24】求算平均差。 個 數 箱數 (f) 組中點X fX 10~20 8 15 120 20~30 12 25
個 數 箱數 (f) 組中點X fX 10~20 8 15 120 20~30 12 25 300 30~40 35 1,225 40~50 20 45 900 50~60 55 1,375 合 計 100 3,920
89
例題二十五 (1) (2)
90
3-6分組資料差異量數之計算 3. 分組資料平均差 (1) 母體資料 (X表示組中點;f表示各組次數 ): (2) 樣本資料:
91
3-6分組資料差異量數之計算 4. 分組資料標準差 (1) 母體資料 (X表示組中點;f表示各組次數 ): 標準差: 變異數: (2) 樣本資料 (X表示組中點;f表示各組次數 ): 變異數:
92
例題二十六 承上題【例題24】求算標準差與變異數。 *解 ( 詳見【例題25】之計算 ) 標準差 (2) 變異數
93
例題二十七 承上題【例題24】求算標準差與變異數。 *解 : ( 請讀者自行練習 )
94
3-7平均數與標準差的應用 在統計學上,若將平均數及標準差結合應用,可提供許多有用的資 料分析方法。
95
3-7平均數與標準差的應用 . . .變異系數 所謂變異係數 (Coefficient of Variation; C.V.),又稱相對差 異量數 (Relative Dispersion),是指絕對差異量數與某種平均數 或其他適當的數值相除之商。相除之後,成為一種無名數,因此在 比較上並無問題。變異係數通常以百分比表示之。當相對差異量數 較小時,表示該組較為集中、整齊。
96
3-7平均數與標準差的應用 . . .變異系數 變異係數的計算方式,最常見是以標準差除以算術平均數。其公式 如下: 1. 母體資料: 2. 樣本資料:
97
例題二十八 西瓜抽出100個,測量其長度平均10公分,標準差1公分,而平均重量20公斤,標準差2.5公斤,試求變異係數並比較之。 *解
(1) 由於長度與重量是不同單位,必須先計算變異係數,才能比 較。 (2) (A) 長度變異係數 。 (B) 重量變異係數 。 ∵ ,∴ 長度的變異係數較小,長度較重量資料集 中、整齊。
98
例題二十九 仁寶公司股票近一年平均報酬率10.25%,標準差0.5%,光寶公司股票近一年平均報酬率5.50%,標準差1.2%,試以變異係數的觀點,比較兩者的風險程度。 *解 (1) 仁寶股票 。 光寶股票 。 ∵ 仁寶股票 光寶股票 。 ∴ 仁寶股票報酬率變動較集中、整齊,因此風險相對較小。
99
例題三十 承上題【例題24】求算變異係數。 *解 ( 詳見【例題24】) (2) ( 詳見【例題26】) (3) 。
100
3-7平均數與標準差的應用 . . .Z分數 所謂Z分數 (Z-Score),是指資料中每一個數值與其算術平均數 之差除以標準差。換言之,乃將原始資料的數值轉化為標準值 (Standard Value) 的一種方法。其計算意義是用來表達某一數值 與平均數之差,是標準差的幾倍。倍數越大,則Z值愈大,代表資 料值相對愈大 ( 其涵意詳見【例題31、32】之說明 )。也由於Z 分數是數據間彼此相除,所以是為無名數,因此其作用乃在於進 行不同單位之資料比較。 1.母體資料: 樣本資料:
101
例題三十一 整箱產品100件,平均長度為50公分,標準差2公分,平均重量30公斤,標準差1.5公斤,其中抽出甲產品一件,測量其長度為52公分,重量27公斤,試問甲產品在整箱產品當中,是長度較長或重量較重? *解 ∵長度與重量單位不同,∴無法直接比較,必須先化為Z分數。 (2) 長度Z分數 。 (3) 重量Z分數 。 (4) ∵長度Z分數重量Z分數,∴甲產品在整箱產品當中,長度相對 較長。
102
例題三十一
103
例題三十二 下表為去年台灣股票市場、債券市場與陳經理個人的投資表現,試求陳經理個人投資的股票與債券之Z分數,並說明陳經理個人那項投資表現較佳? *解 (1) 股票Z分數 。 (2) 債券Z分數 。 (3) ∵ 股票Z分數0.959>債券Z分數-2.43,∴ 陳經理個人投資 表現以股票較佳。 股票市場 債券市場 平均報酬率 15.80% 4.23% 標準差 4.00% 0.30% 陳經理報酬率 18.18% 3.50%
104
3-7平均數與標準差的應用 . . .謝比雪夫定理 當研究者想了解,在一群資料當中,到底有多少百分比 ( 或多少 個數值 ) 會落在平均數加減幾個標準差的範圍內,則可利用謝比 雪夫定理測得。 所謂謝比雪夫定理 (Chebyshev‘s Theorem),是由數學家 Chebyshev (1821-1894) 所提出,他發現平均數與標準差有某種 關係存在,如下所示: “一群資料至少有 % 的數值,會落在平均數附近k個 標準差 之範圍內”。
105
3-7平均數與標準差的應用 . . .謝比雪夫定理 1. 當 時,表示必定會有數值落在 之區間內。 2. 當 時,至少有 之資料值,會落在 之區 間內。 3. 當 時,至少有 之資料值,會落在 之區間內。
106
例題三十三 假定某產品100件,其平均重量為30公斤,標準差2公斤,試以謝比雪夫定理 (Chebyshev's Theorem) 說明下列問題: (1) 重量在28公斤~32公斤的產品至少有多少件? (2) 重量在26公斤~34公斤的產品至少有多少件? (3) 重量在24公斤~36公斤的產品至少有多少件?
107
例題三十三 *解 重量在28公斤~32公斤的產品,得知 ,表示必定有產品在此範圍內。 (2) 重量在26公斤~34公斤的產品,得知
,因此至少 產品 (75件 ),在此範圍內。 重量在24公斤~36公斤的產品,得知 ,因此至少 產品 (88件 ),在此範圍內。
108
3-7平均數與標準差的應用 . . .謝比雪夫定理 謝比雪夫定理的優點之一,是適合任何資料的使用,不管資料分 配形態如何,但其缺點是計算值僅為保守的大略值。但若資料為 鐘形 (Bell-Shaped或呈對稱 ) 形狀的分配 ( 若資料個數夠多, 大都為鐘形 ( 或呈對稱 ) 形狀 ),則適合使用“經驗法則”較 為精確。 所謂經驗法則 (Empirical Rule),是指根據統計學者多年的經驗 研究,亦發現與謝比雪夫定理有類似現象,並且能夠大約地說出 一群資料其平均數與標準差的關係。
109
3-7平均數與標準差的應用 . . .謝比雪夫定理 1. 資料需為鐘形 ( 或呈對稱 ) 形狀的分配,如下所示:
110
3-7平均數與標準差的應用 . . .謝比雪夫定理 2. 經驗法則內容: (1) 當 時,約有68% 之資料值,會落在 之區 間內。 (2) 當 時,約有95% 之資料值,會落在 之 區間內。 (3) 當 時,約有99.7% 之資料值,會落在 之區間內。
111
例題三十四 承上題【例題33】,假設資料呈鐘形 ( 或呈對稱 ) 形狀的分配,試做上述問題。 *解
(1) 重量在28公斤~32公斤的產品,得知 ,表示有68% (68件 ) 產品在此範圍內。 (2) 重量在26公斤~34公斤的產品,得知 ,因此有95% 產品 (95件 ),在此範圍內。 重量在24公斤~36公斤的產品,得知 ,因此至有99.7% 產品 (99件 ),在此範圍內。
112
例題三十四
113
3-7平均數與標準差的應用 . . .箱形圖 箱形圖 (Box-Plots),又稱盒形圖、盒鬚圖 (Box-and-Whisker Plots),是由統計學者J.W.Tukey所提出的一種資料統計量數之表 達方法。其目的在利用下列五數,將資料加以表達,以顯現出資 料的分布情況,藉此探索資料的特形,作為進一步研究的基礎。 在箱形圖上,可看出一群資料的五個彙總數值 (Five-number Summary) 之排列情形: 1. 最小值。 2. 最大值。 3. 第一個四分位數。 4. 中位數 (Me)。 5. 第三個四分位數。
114
3-7平均數與標準差的應用 . . .箱形圖 其圖形特點如下所示: 1. Me將資料分成左右兩半 ( 各50% )。 2. 四分位距。 3. 內籬與。 4. 外籬與。 5. 鬚:圖中虛線稱為鬚 (Whisker),是指箱形 ( 實體部份與所成 ) 的兩邊至內籬線的最大值 ( 右鬚 ) 與最小值 ( 左鬚 )。 6. 輕籬群值 (Mild Outliers):資料落在內籬與外籬之間。 7. 極端籬群值 (Extreme Outliers):資料落在外籬之外側。
115
3-7平均數與標準差的應用 . . .箱形圖 8. 以中位數為中心點,若箱形居中則不偏,居左則右偏,居右則左偏。 ( 箱形居左:表示;反之,則箱形居右。) 9. 右鬚較左鬚長,則箱形居左,表右偏;左鬚較右鬚長,則箱形居右,表左偏。 10.不需計算平均數與標準差,即可知道資料之分布情形,是其特 點。
116
例題三十五 十家賣場某天營業額 ( 單位:萬 ) 為 12, 18, 16, 20, 21, 33, 35, 31, 45, 40
試以箱形圖表示。 *解 (1) ( 計算詳見【例題20】)。 (2) 內籬 與 。 (3) 外籬 與 。 (4) 沒有籬群值,所有資料數值都落在隔籬內。 鬚:最大值=45 ( 右鬚 ) 與最小值=12 ( 左鬚 )。
117
例題三十五 (6) 以中位數 (26) 為中心點,箱形居左 比 短 ) 表示右偏分配;以鬚判斷,右鬚長度比左鬚長
(6) 以中位數 (26) 為中心點,箱形居左 比 短 ) 表示右偏分配;以鬚判斷,右鬚長度比左鬚長 ,箱形居左,表示大於 之25%之資料比小於 之資料25% 分散,故為右偏分配。
118
3-8偏態係數與峰態係數 . . .偏態係數 所謂偏態係數 (Coefficient of Skewness),是指表示單峰次數分 配的偏態狀態之量數。 偏態係數有下列三種形態:
119
3-8偏態係數與峰態係數 . . .偏態係數 偏態係數=0,表示不偏,左右完全對稱的分配,如下圖所示: 2. 偏態係數>0,表示正偏 ( 右偏 ) 分配 ( 單峰在左,長尾在右 ),如下圖所示: 3. 偏態係數,表示負偏 ( 左偏 ) 分配 ( 單峰在右,長尾在左 ),如下圖所示:
120
3-8偏態係數與峰態係數 . . .峰態係數 所謂峰態係數 (Coefficient of Kurtosis),是指表示單峰次數分 配峰態高低的一種量數。 峰態係數有下列三種形態:
121
3-8偏態係數與峰態係數 . . .峰態係數 1. 峰態係數=3,稱為常態峰。如下圖所示: 2. 峰態係數>3,稱為高狹峰。如下圖所示: 3. 峰態係數<3,稱為低闊峰。如下圖所示:
Similar presentations