STATA 7 蘇國賢
摘要統計 開啟91q1.dta 計算受訪者在民國92年時的年齡。 畫出年齡的histogram。 求年齡的敘述統計。
summarize的語法 summarize [varlist] [if] [in] [weight] [, options]
summarize的語法 標準差 summarize age 觀察值個數 平均值
summarize的語法 中位數 summarize age, detail 百分位數 最小的幾個觀察值
histogram 畫出age 分佈的直方圖,並在圖上標示平均年齡。
histogram 平均線被遮住,看不清楚
histogram 將bar的顏色變成透明none
請練習在圖上加入適當標籤
百分位數 X1 X2 X3 Xp Xn p% (100-p)% Suppose the observations x1,x2,…xn have been arranged in ascending order. The pth percentile is the value xp such that p% of the observations are less than or equal to xp and (100-p)% of the observations are greater than or equal to xp. Xp為第p個百分位數,則「小於XP的觀察值佔所有觀察值的p%」。
未分組資料求百分位數 X1 X2 X3 Xp Xn 1 p 100 整數,則p分位數= 第i與第(i+1)個觀察值的平均值 在一百個中間的第p個,相當於在n中間的第幾個? i 非整數,則p分位數= i下一個觀察值
用cum.找分位數 利用次數分配表中的以下累加百分比,找出age的 25th分位數、50th分位數、75th 分位數。
佔25%的觀察值 25th分位數 = Q1 佔25%的觀察值 50th分位數 = Q2 佔25%的觀察值 75th分位數 = Q3
Box plot age
Box plot 將原圖選轉180度
年紀最輕的25%受訪者 Q1 = 31歲 中位數 = 43歲 Q3 = 56歲 年紀最長的前25%受訪者
Box plot 用generate創造female變數,並貼上適當標籤。
Box plot
Box Plot(箱型圖) Extreme Outliers Q3 Median Q1 Outer fence Extremes: Cases with values more than 3 box lengths from the upper or lower edge of the box. Inner fence Q3 IRQ Median Q1 Cases with values between 1.5 and 3 box lengths from the upper or lower edge of the box. The box length is the IRQ. 1.5 IRQ Inner fence 3 IRQ Outliers Outer fence
Box plot
Box plot
Box plot sum age if female==0 sum age if female==1
Recode recode varlist (rule) [(rule) ...] [, generate (newvarlist) ]
Recode recode varlist (rule) [(rule) ...] [, generate (newvarlist) ] example (1 2 3 = 3) (1/3 = 3) 可用recode 與generate並用來創造新的變數 recode V1 (2=1)(1=0), gen(gender)
Summarize recode V9Y (97 99=.) gen sage = 92 – V9Y tab sage
問題 用if statements創造一新變數agegroup,將age進行平分成四組。 用recode將配偶的年齡平分成四組。
資料分組 按照age將樣本平分成四組,繪出各組的box plot egen (extensions to generate) egen [type] newvar = fcn(arguments) [if exp] [in range] [, options]
資料分組 cut函數將資料切割成指定數目的組數 cut(varname), {at(#,#,...,#)|group(#)} [icodes label] group(#) specifies the number of equal frequency grouping intervals to be used in the absence of breaks. egen agegrp=cut(age), group(4)
資料分組 graph hbox age, medtype(line) over(agegrp)
資料分組 cut(varname), {at(#,#,...,#)|group(#)} [icodes label] egen age60=cut(age), at(0,60,100) 分成60以上與以下兩組,以上age60數值為60,60歲以下者為0 egen age60b=cut(age), at(0,60,100) icodes 分成60以上與以下兩組,以上age60數值為1,60歲以下者為0
資料分組
Functional graph
Functional graph
Functional graph
Functional graph
Functional graph