Chapter 4 Variability 離散趨勢測量 2019/4/26
Variability資料離散值 知道離散值得目的 離散值可具體描述資料分佈是集中或分散 離散值可告訴我們某個統計值(ex. Mean)是否具有代表性 2019/4/26
Measures of variability Index of Qualitative Variation (IQV) 屬質變異指數 Range 全距 Interqartile Range (IQR) 四分位距 Semi-interquartile range Variance 變異數 Standard Deviation 標準差 Coefficient of variation 變異係數 2019/4/26
Index of Qualitative Variation (IQV) 屬質變異指數 0: 無差異,1: 有差異 Used with nominal variables IQV= K= # of category N=cases Σf2=sum of the squared frequency (次數平方的總合) 2019/4/26
練習 求下列三組族群之IQV 並比較哪一族群人種最多元? Group A Group B Group C White 90 Black 0 Other 0 Total 90 White 60 Black 20 Other 10 White 30 Black 30 Other 30 Total 90 2019/4/26
Range 全距 全距愈大 資料愈分散 提供一個粗略的離散值估算 缺點 完全由頭尾極端值來決定資料離散程度 全距相同,資料離散程度未必相同 Difference between the highest and lowest score Range = URL Xmax –LRL Xmax Range = 最高分 - 最低分 全距愈大 資料愈分散 提供一個粗略的離散值估算 缺點 完全由頭尾極端值來決定資料離散程度 全距相同,資料離散程度未必相同 未考慮到所有觀察值,故無法精確的反應全體觀察值分散情形 2019/4/26
Interqartile Range (IQR) 四分位距 以中間50%的頭尾值相差大小來決定資料離散的程度 (ignores lower and upper 25%) IQR=Q3-Q1 Semi-interquartile range = IQR/2 缺點 未考慮到所有觀察值 未考慮到所有觀察值,故無法精確的反應全體觀察值分散情形 2019/4/26
練習 將全班100人考試成績排序所得之第一四分位(Q1) 是48.5,第二四分位(Q2)是55,第三四分位(Q3)是59.5。 計算全班成績的四分位距(IQR)& SemiIQR 2019/4/26
好的離散值應具備條件 Use all the scores in the distribution Describe the typical deviation of the scores Increase in value as the distribution of scores becomes more heterogeneous 2019/4/26
有沒有一個離散值是考慮到所有觀察值的? 2019/4/26
2019/4/26
Either 用距離絕對值 or 距離平方 2019/4/26
絕對值 平方 2019/4/26
平均絕對差 (Average Deviation) 變異數 (Variance) 標準差 (Standard Deviation) 有三類 平均絕對差 (Average Deviation) 變異數 (Variance) 標準差 (Standard Deviation) 2019/4/26
Scores Deviation X-μ 10 20 30 40 50 -20 -10 ΣX=150 Σ(X-μ)=0 μ=30 ΣX=150 Σ(X-μ)=0 μ=30 2019/4/26
Average Deviation (AD) 平均絕對差 2019/4/26
Population Variance 母體變異數 Squared deviation deviation SS (sum of squares) σ2=SS/N 2019/4/26
σ2= = 概念公式 計算公式 2019/4/26
Sample Variance 樣本變異數 Sample variance (S2) : Sum of Squared (SS) Degree of freedom (df) 2019/4/26
S2= = 概念公式 計算公式 2019/4/26
Variance 的性質 Variance 值愈大: 資料離散程度愈大 Variance 值愈小: 資料離散程度愈小 考慮每一個觀察值 平方不利解釋 2019/4/26
Standard Deviation (St. D.) 標準差 母體標準差 σ= 樣本標準差 Ѕ = 2019/4/26
標準差 因變異數為平方值,不利解釋,故開更號去除平方,得標準差! 2019/4/26
Coefficient of Variation 變異係數 (CV) CV適用於比較兩組單位不同的資料 (ex. 身高vs. 體重) 母體CV= 樣本CV= 2019/4/26
練習 就以下列資料 3, 5,10,1,6 分別視為母體和樣本資料,求變異數及標準差? 母體變異數: ______ 就以下列資料 3, 5,10,1,6 分別視為母體和樣本資料,求變異數及標準差? 母體變異數: ______ 母體標準差: ______ 樣本變異數: ______ 樣本標準差: ______ 2019/4/26
練習 根據下列20名學生(sample) 之數學成績 計算 70 75 82 85 64 35 90 68 75 84 85 75 77 90 55 84 85 84 72 79 計算 Mean Median Mode Range IQR Variance & Standard Deviation P85 D6 2019/4/26
When should we use each of the measures of central tendency? If you have nominal data, only use the mode Use the median when data are extremely skewed since it is not affected by extreme scores Other, use the mean 2019/4/26
When to use which measure of dispersion? Use IQV for nominal variables Use the range only as a crude measure Use the interquartile range (IQR) when data are extremely skewed (report the median) Otherwise, report the SD with the mean 2019/4/26