資料的描述: 在研讀完本章之後,您應當能夠進行下列事項: CHAPTER 3 目標 位置和離差的測量 3-1 CHAPTER 3 資料的描述: 位置和離差的測量 目標 在研讀完本章之後,您應當能夠進行下列事項: 1.計算算數平均數、中位數、眾數、加權平均數和幾何平均 數。 2.解釋各種量數的特性、用處、優點及缺點。 3.判別算數平均數、中位數、眾數在對稱及不對稱分配中的 位置。 4.計算和說明全距、平均差、變異數及標準差。
資料的描述: CHAPTER 3 位置和離差的測量 5.解釋各種差異量數的特徵、用處、優點及缺點。 6.了解柴比雪夫定理和經驗法則。 3-2 CHAPTER 3 資料的描述: 位置和離差的測量 5.解釋各種差異量數的特徵、用處、優點及缺點。 6.了解柴比雪夫定理和經驗法則。 7.計算和說明四分位數、四分位距及變異係數。
母體平均數 對於原始資料 母體平均數 就是母體中所有原始資料的數值加總後,再除以原始資料的總數。 其中, µ 是母體平均數。 3-3 母體平均數 對於原始資料 母體平均數 就是母體中所有原始資料的數值加總後,再除以原始資料的總數。 其中, µ 是母體平均數。 N為母體中所有個體的總數。 X代表任何特殊值。 指加法運算。
3-4 範例一 參數: 可以測量母體的特徵。 Kiers家擁有4部車輛。每部車輛行駛的總英哩數為:56,000、 23,000、 42,000和73,000。 試求平均行駛英哩數。 平均數為 (56,000 + 23,000 + 42,000 + 73,000)/4 = 48,500
3-5 樣本平均數 對於未被分組的資料,樣本平均數是所有樣本數值的總和除以樣本數目。 其中,X 代表樣本平均數。 n 是在樣本中的觀察數目。
3-6 範例二 統計量:樣本可測定的特徵。 舉一例,有五位主管組成一樣本,其去年分別得到年終獎金如下:$14,000、 $15,000 、$17,000、$16,000and $15,000。試求這5位主管的平均年終獎金。 這5個數值代表一樣本,是故樣本平均數為 (14,000+15,000+17,000+16,000+15,000)/5 = $15,400。
加權平均數 加權平均數:一組數字 X1、X2、…… 、 Xn,擁有加權 w1、 w2、…… 、wn,該組數字的加 權平均數可計算如下: 3-9 加權平均數 加權平均數:一組數字 X1、X2、…… 、 Xn,擁有加權 w1、 w2、…… 、wn,該組數字的加 權平均數可計算如下: Xw=(w1X1+w2X2+ … +wnXn)/(w1+w2+ … +wn) Xw=Σ(wX)/Σw
3-10 範例四與中位數 某個炎熱的週六下午,克利斯在一小時內賣出了50瓶飲料。計算這些飲料價格的加權平均數 (價格($),銷售量): (.50,5)、(.75,15)、 (.90,15)、(1.10,15)。 加權平均數為$(.50×5 + .75×15 + .90×15 + 1.10×15)/(5 + 15 + 15 + 15) = $43.75/50 = $0.875
中位數 中位數:將一組數值按大小排列取其中間項目,此數值便是中位數。 資料列中,在中位數之上或下有相等的數量值。 3-11 中位數 中位數:將一組數值按大小排列取其中間項目,此數值便是中位數。 資料列中,在中位數之上或下有相等的數量值。 注意:在一組偶數的數字中,中位數是取中間的兩個數字的算數平均數。
範例五 計算下列資料的中位數。 5位大學生組成一樣本,其年齡分別為21、25、19、 20 和 22。 3-12 範例五 計算下列資料的中位數。 5位大學生組成一樣本,其年齡分別為21、25、19、 20 和 22。 以小到大排列方式,將這些資料排列如下:19、20、21、22、 25。於是中位數為 21。 4個棒球球員的身高(以英吋表示)分別為76、73、80 和 75。 以矮到高排列方式,將這些資料排列如下:73、75、76、80。於是中位數為 75.5。
中位數的性質 在一組資料中只有一個中位數。 中位數不受極端值的影響,因此若有極端值出現,中位數是極佳的集中趨勢量數。 3-13 中位數的性質 在一組資料中只有一個中位數。 中位數不受極端值的影響,因此若有極端值出現,中位數是極佳的集中趨勢量數。 中位數的計算適合等比尺度、等距尺度及等級尺度。 在開區間的次數分配中,若中位數並不位於該開區間組,我們仍可計算得到中位數。
3-14 眾數 眾數:出現次數最多的觀察值。 範例六:10個學生的考試成績如下:81、 93、84、75、68、87、81、75、81、87。所有成績中 81出現最多,是故成績的眾數為 81。
幾何平均數 幾何平均數 用於計算百分比、比例、指數或成長率的平均數 3-15 幾何平均數 幾何平均數 用於計算百分比、比例、指數或成長率的平均數 一組n個數字之幾何平均數 (GM ) 可定義為這n 個數字乘積後,再開n 次方根。其公式如下:
範例七與幾何平均數 三種債券的利率分別是5%、7% 和 4%。 幾何平均數為 =5.192。 3-16 範例七與幾何平均數 三種債券的利率分別是5%、7% 和 4%。 幾何平均數為 =5.192。 算數平均數為 (5 + 7 + 4)/3 =5.333。 幾何平均數提供的利息較少,因為它的加權並不倚重 7% 。
幾何平均數(續) 幾何平均數的另一使用方法是在計算下列事項從一時期到另一時期的平均增加率:銷售、生產或經濟數列。這個問題形態的公式如下: 3-17 幾何平均數(續) 幾何平均數的另一使用方法是在計算下列事項從一時期到另一時期的平均增加率:銷售、生產或經濟數列。這個問題形態的公式如下:
範例八 美國女性就讀大學的總人數,從1990年的755,000人增加到1999年的835,000人。 3-18 範例八 美國女性就讀大學的總人數,從1990年的755,000人增加到1999年的835,000人。 其中,n = 9,由1999 – 1990得知。 亦即,幾何平均數意指年增率為 1.13%.
3-19 分組資料的平均數 分組成次數分配的資料之算數平均數,可經由以下公式計算而得: X:組中點 f:次數
3-20 範例九 大都會10家電影院上週電影放映總數如下。計算電影放映平均數。
3-21 範例九 續上頁 電影放映數 次數( f ) 組中點(Xi ) (f)(X) 1~ 2 1 1.5 3~ 4 2 3.5 7.0 5~ 6 3 5.5 16.5 7~ 8 7.5 9~10 9.5 28.5 總數 10 61 61/10 = 6.1 部電影
已分組資料的中位數 對分組成次數分配的資料,欲求算其算數平均數可經由以下公式計算而得: 3-22 已分組資料的中位數 對分組成次數分配的資料,欲求算其算數平均數可經由以下公式計算而得: 中位數 = L + [(n/2 - CF)/f] (i) 其中, L 是中位數所在組的下界(數值較小的組界),CF 是累加到中位數所在前一組之次數總和,f 是中位數所在組的次數,而 i 是中位數所在組的組距。
找出中位數組 計算分組資料的中位數組: 建立累加次數分配。 將資料值的總數除以2。 3-23 找出中位數組 計算分組資料的中位數組: 建立累加次數分配。 將資料值的總數除以2。 求出哪一組包含中位數。舉例來說,假若 n=50、50/2 = 25,求出哪一組包含第25個值-——即中位數組。
3-24 範例十 電影放映數 次數 累加次數 1~ 2 1 3~ 4 2 3 5~ 6 6 7~ 8 7 9~10 10 中位數組是5~6這一組,因為它包含第5個值(n/2 =5)。
範例十續上頁 由上表得知 L=5, n=10, f=3, i=2, CF=3。 3-25 範例十續上頁 由上表得知 L=5, n=10, f=3, i=2, CF=3。 因此,中位數= 5 + [((10/2) - 4)/3](2)= 6.33。
分組資料的眾數 分組資料的眾數可由最大次數組之組中點來估計之。 3-26 分組資料的眾數 分組資料的眾數可由最大次數組之組中點來估計之。 在範例十中的眾數是 5.5 和 9.5。如範例十所示,當有兩個數值產生大量次數時,此分配可稱為雙眾數。
3-27 對稱分配 無偏態 眾數 = 中位數 = 平均數
3-28 右偏分配 右偏分配:平均數和中位數在眾數的右邊。 眾數<中位數<平均數
3-29 左偏分配 左偏分配:平均數和中位數在眾數的左邊。 平均數<中位數<眾數
差異變數: 未分組資料 全距 = 最大值 – 最小值。 就未分組資料而言,全距 是指一組資料中最大值與最小值的差異。 3-30 差異變數: 未分組資料 就未分組資料而言,全距 是指一組資料中最大值與最小值的差異。 全距 = 最大值 – 最小值。 範例十一:5位會計系畢業生的樣本中,其初始薪資分別為:$22,000、$28,000、$31,000、$23,000、$24,000。其全距為$31,000 - $22,000 = $9,000。
3-31 平均差 平均差:一數列的各數值與其算數平均數之差的絕對值的算數平均數。
範例十二 書店裝書木箱樣本的重量分別為:103、97、101、106、103磅。 X = 510/5 = 102 磅。 3-32 範例十二 書店裝書木箱樣本的重量分別為:103、97、101、106、103磅。 X = 510/5 = 102 磅。 X = 1+5+1+4+1 = 12 MD = 12/5 = 2.4 通常木箱的平均重量 102 磅,其平均差 2.4磅。
3-33 母體變異數 母體變異數:未分組資料的母體變異數是以各數值與其母體平均數差的平方之算數平均。
3-34 範例十三 Dunn家人的年齡分別為2、18、34 和 42 歲。試求其母體變異數。
3-35 母體變異數(二) 另一母體變異數的公式。
3-36 母體標準差 母體標準差 ( )是母體變異數的平方根。 就 範例十三而言,其母體標準差為 15.19 ( 230.81的平方根)。
3-37 樣本變異數 樣本變異數估計母體變異數。
範例十四 校園中各式各樣的工作樣本,其每小時的工資分別為:$7、$5、$11、$8、$6,求出其變異數。 X = 37/5 = 7.40 3-38 範例十四 校園中各式各樣的工作樣本,其每小時的工資分別為:$7、$5、$11、$8、$6,求出其變異數。 X = 37/5 = 7.40 = 21.2/(5-1) = 5.3
3-39 樣本標準差 樣本標準差是樣本變異數的平方根。 在範例十四中,樣本標準差 = 2.30
3-40 已分組資料的樣本變異數 已分組樣本變異數的公式可作為母體變異數的估計項。 其中 ,f 是各組次數,而 X 是組中點。
3-41 標準差的詮釋和用途 柴必雪夫定理:對任何數值群而言,無論是母體或樣本,位於算數平均數 k 個標準差範圍內的數值,佔有數值比例至少為 1 - 1/ k2 。其中,k 表示任何大於 1的常數。
3-42 標準差的詮釋和用途 經驗法則:對對稱的鐘形次數分配而言,大約 68% 的數值位於平均數( )加減1個標準差( )的範圍內;大約 95% 之數值位於平均數( )加減2個標準差( )的範圍內;大約 99.7% 之數值位於平均數( )加減3個標準差( )的範圍內。
對稱的鐘形分配顯示標準差(σ) 及平均數(μ)之間的關係 3-43 對稱的鐘形分配顯示標準差(σ) 及平均數(μ)之間的關係 m-3s m-2s m-1s m m+1s m+2s m+ 3s 前程企業
3-44 相對差異量數 變異係數:次數分配之標準差對其算數平均數的比值,以百分比計算。
3-45 百分位(Lp) 百分位計算公式
內四分位全距 內四分位全距:內四分位全距是介於第一個四分位Q1與第三個Q3四分位之間的距離。 3-46 內四分位全距 內四分位全距:內四分位全距是介於第一個四分位Q1與第三個Q3四分位之間的距離。 內四分位全距 = 第三個四分位 – 第一個四分位 = Q3 - Q1
3-47 四分位差 四分位差(QD):四分位差是第三個四分位 Q3 和第一個四分位Q1 之間距離的一半。 QD = [Q3 - Q1]/2
3-48 範例十五 假設第三個四分位 = 24 且第一個四分位 = 10, 試求其四分位差。其內四分位全距為 24 - 10 = 14;於是四分位差為 14/2 = 7。
箱形圖 箱形圖 是一種圖形的表示,它是根據四分位以圖形來表示的一組資料。 繪製箱型圖需要五種統計量:最小值、第 3-49 箱形圖 箱形圖 是一種圖形的表示,它是根據四分位以圖形來表示的一組資料。 繪製箱型圖需要五種統計量:最小值、第 一個四分位數 Q1 、中位數、第三個四分位數 Q3 和最大值。
3-50 範例十六 基於一個20次外送時間的樣本, Marco披薩店發現以下的資訊:最短時間 = 13 分鐘,Q1 = 15分鐘,中位數 = 18分鐘,Q3 = 22分鐘,最長時間 = 30分鐘。試利用上述外送時間,畫一箱形圖。
3-51 範例十六 續上頁 中位數 最小值 Q1 Q3 最大值 12 14 16 18 20 22 24 26 28 30 32 分鐘