Presentation is loading. Please wait.

Presentation is loading. Please wait.

STATA 7 蘇國賢.

Similar presentations


Presentation on theme: "STATA 7 蘇國賢."— Presentation transcript:

1 STATA 7 蘇國賢

2 摘要統計 開啟91q1.dta 計算受訪者在民國92年時的年齡。 畫出年齡的histogram。 求年齡的敘述統計。

3 summarize的語法 summarize [varlist] [if] [in] [weight] [, options]

4 summarize的語法 標準差 summarize age 觀察值個數 平均值

5 summarize的語法 中位數 summarize age, detail 百分位數 最小的幾個觀察值

6 histogram 畫出age 分佈的直方圖,並在圖上標示平均年齡。

7 histogram 平均線被遮住,看不清楚

8 histogram 將bar的顏色變成透明none

9 請練習在圖上加入適當標籤

10 百分位數 X1 X2 X3 Xp Xn p% (100-p)% Suppose the observations x1,x2,…xn have been arranged in ascending order. The pth percentile is the value xp such that p% of the observations are less than or equal to xp and (100-p)% of the observations are greater than or equal to xp. Xp為第p個百分位數,則「小於XP的觀察值佔所有觀察值的p%」。

11 未分組資料求百分位數 X1 X2 X3 Xp Xn 1 p 100 整數,則p分位數= 第i與第(i+1)個觀察值的平均值
在一百個中間的第p個,相當於在n中間的第幾個? i 非整數,則p分位數= i下一個觀察值

12 用cum.找分位數 利用次數分配表中的以下累加百分比,找出age的 25th分位數、50th分位數、75th 分位數。

13 佔25%的觀察值 25th分位數 = Q1 佔25%的觀察值 50th分位數 = Q2 佔25%的觀察值 75th分位數 = Q3

14 Box plot age

15 Box plot 將原圖選轉180度

16 年紀最輕的25%受訪者 Q1 = 31歲 中位數 = 43歲 Q3 = 56歲 年紀最長的前25%受訪者

17 Box plot 用generate創造female變數,並貼上適當標籤。

18 Box plot

19 Box Plot(箱型圖) Extreme Outliers Q3 Median Q1 Outer fence
Extremes: Cases with values more than 3 box lengths from the upper or lower edge of the box. Inner fence Q3 IRQ Median Q1 Cases with values between 1.5 and 3 box lengths from the upper or lower edge of the box. The box length is the IRQ. 1.5 IRQ Inner fence 3 IRQ Outliers Outer fence

20 Box plot

21 Box plot

22 Box plot sum age if female==0 sum age if female==1

23 Recode recode varlist (rule) [(rule) ...] [, generate (newvarlist) ]

24 Recode recode varlist (rule) [(rule) ...] [, generate (newvarlist) ]
example (1 2 3 = 3) (1/3 = 3) 可用recode 與generate並用來創造新的變數 recode V1 (2=1)(1=0), gen(gender)

25 Summarize recode V9Y (97 99=.) gen sage = 92 – V9Y tab sage

26 問題 用if statements創造一新變數agegroup,將age進行平分成四組。 用recode將配偶的年齡平分成四組。

27 資料分組 按照age將樣本平分成四組,繪出各組的box plot egen (extensions to generate)
egen [type] newvar = fcn(arguments) [if exp] [in range] [, options]

28 資料分組 cut函數將資料切割成指定數目的組數
cut(varname), {at(#,#,...,#)|group(#)} [icodes label] group(#) specifies the number of equal frequency grouping intervals to be used in the absence of breaks. egen agegrp=cut(age), group(4)

29 資料分組 graph hbox age, medtype(line) over(agegrp)

30 資料分組 cut(varname), {at(#,#,...,#)|group(#)} [icodes label]
egen age60=cut(age), at(0,60,100) 分成60以上與以下兩組,以上age60數值為60,60歲以下者為0 egen age60b=cut(age), at(0,60,100) icodes 分成60以上與以下兩組,以上age60數值為1,60歲以下者為0

31 資料分組

32 Functional graph

33 Functional graph

34 Functional graph

35 Functional graph

36 Functional graph


Download ppt "STATA 7 蘇國賢."

Similar presentations


Ads by Google