Download presentation
Presentation is loading. Please wait.
Published byあきひさ とどろき Modified 5年之前
1
楊志強 博士 cyang@tea.ntue.edu.tw http://tea.ntue.edu.tw/~cyang
統計學 楊志強 博士
2
統計量數 Statistical Measures
3
Measures of Central Tendency
集中趨勢量數 Measures of Central Tendency
4
平均數(Mean) 母體: 樣本: 所有資料皆列入計算 易受其極端值(Extreme Value)影響 離差(Deviation)之和為零 離差平方和為最小
5
中位數(Median,Me) n是奇數時: n是偶數時: 不受極端值影響。 敏感度不夠。
6
眾數(Mode,Mo) 一組資料中出現最多的數值。 不受極端值影響。 不具唯一存在特性。
7
Measures of Relative Position
相對地位量數 Measures of Relative Position
8
將資料依大小排序並分割成100等分(即有99個等分點),每個等分點則為百分位數。 計算步驟:
百分位數(Percentile,Pk) 將資料依大小排序並分割成100等分(即有99個等分點),每個等分點則為百分位數。 計算步驟: 排序由小而大:X1,X2,X3…Xi i有小數,無條件進一。 i為整數,則取i與i+1的數值平均值。
9
四分位數(Quartile,Qk) 第一四分位數(First/Lower-Quartile) 第二四分位數(Second-Quartile) 第三四分位數(Third/Upper-Quartile)
10
差異量數 Dispersion Measures
11
全距(Range) 易於計算 易受最大與最小值影響 無法測出中間各觀察值間的差異情形
12
四分位差(Quartile Deviation, QD)
IQR為四分位距(Interquartile-Range) 較不受極端值影響 只考慮50%的資料 若以中位數為一組資料集中趨勢量數,則輔以四分位差來代表其差異情形。
13
變異數(Variance) 母體: 樣本: 變異數小,代表大部分數值集中於平均數附近,平均數代表性高;反之,平均數代表性低。
每個觀察值皆列入計算,敏感度高。 易受極端值影響。 若以平均數為一組資料的集中趨勢量數,則輔以變異數或標準差來代表其差異情形。
14
標準差(Standard Deviation)
母體: 樣本: 變異數單位為平方,較難解釋;開平方根得標準差,使單位還原。 特性與變異數相同。
15
以統計量數診斷資料分配的型態
16
中位數、眾數與平均數間的位置關係 對稱(Symmetrical)分配 右偏(Positively Skewed, Skewed to the Right)分配 左偏(Negatively Skewed, Skewed to the Left)分配
17
盒鬚圖(Box-and-Whisker Plot)
盒狀圖(Box Plot)
18
以盒鬚圖檢視界外值 1.5IQR為內圍值(Inner Fence) 3IQR為外圍值(Outer Fence)
觀察值落在內、外圍值之間,稱為平穩界外值(Mild outlier) 觀察值落在外圍值之外,稱為極端界外值(Extreme outlier)
19
常見的資料分配
20
標準常態分配 Z~N(0,1) 以μ為中心,兩邊完美對稱。 平均數、中數、中位數同為0。 完美鐘型(bell-shaped)。
21
常態分配 x~N(μ,σ2) 分配形狀為鐘型。 以平均數為中心,兩邊完全對稱。 標準化公式:
Similar presentations