Presentation is loading. Please wait.

Presentation is loading. Please wait.

R教學 單元5 敘述統計 羅琪老師.

Similar presentations


Presentation on theme: "R教學 單元5 敘述統計 羅琪老師."— Presentation transcript:

1 R教學 單元5 敘述統計 羅琪老師

2 敘述性統計量 針對定量資料,可以利用平均數、中位數及眾數等來瞭解資料的集中趨勢,利用標準差、四分位距及全距等來了解資料的分散程度,也可以藉著最大值及最小值來看資料的分布是否介在合理的範圍內,還是有輸入錯誤等問題。 針對定性資料,則常以個數及百分比來表示資料的分布情形。

3 變數的命名 填表日:民國(v_y)年(v_m)月(v_d)日 姓名(name): ___________
流水號(id) 睡眠與壓力調查 填表日:民國(v_y)年(v_m)月(v_d)日 姓名(name): ___________ 性別(sex): _____ 0:女 1: 男 出生年月日: 民國(b_y)年(b_m)月(b_d)日 身高(height): _____ 公分 體重(weight): _____ 公斤 壓力有無(pressuID):____ 0: 無 1: 有 壓力程度(pressure):____ 0: 無 1: 中等 2: 大 最近兩個月平均睡眠時間(sleepHR1):___小時 (取自小數點第一位) 請回憶兩個月前之平均睡眠時間(sleepHR0):___小時 (取自小數點第一位) 最近兩個月是否有睡眠困擾問題(sleepTR1):___0: 無 1: 有 請回憶兩個月前是否有睡眠困擾問題(sleepTR0):___ 0: 無 1: 有 最近兩個月的睡眠品質(sleepQOL):___ 1:很不好 2:不好 3:普通 4:好 5:很好

4 資料讀取 最近兩個月平均睡眠時間(sleepHR1,單位:小時)為連續變數故可求其平均值、標準差、百分位數…等。
> sleepdata<-read.csv("c:/RData/sleepdata.csv",header=T) > sleepdata > attach(sleepdata) 最近兩個月平均睡眠時間(sleepHR1,單位:小時)為連續變數故可求其平均值、標準差、百分位數…等。

5 sleepdata資料檔 id v_y v_m v_d name sex b_y b_m b_d height weight
pressuID pressure sleepHR1 sleepHR0 sleepTR1 sleepTR0 sleepQOL 1 97 25 Java 66 12 161.5 65 8.5 8.7 3 2 Alice 58 5 6 154.5 55 7.3 7.4 4 June 174.6 70 7 7.5 Jack 64 164 42 7.9 Jacoby 49 24 150 50 6.8 6.1 Peter 20 162 63 6.3 48 Kalare 72 176 9.3 Jame 73 9 28 155 45 8.9 Andy 67 10 7.7

6 定量變數的敘述性統計 > summary(sleepHR1) Min. 1st Qu. Median Mean 3rd Qu. Max 最近兩個月平均睡眠時間的平均數為7.78小時, 中位數為7.80小時 > sd(sleepHR1) # 標準差 [1] 最近兩個月平均睡眠時間的標準差為 小時

7 定量變數的敘述性統計 > quantile(sleepHR1,0.05) # 5百分位數 5% 最近兩個月有5%的受訪者平均睡眠時間<=6.145小時 > quantile(sleepHR1,0.95) # 95百分位數 95% 最近兩個月有95%的受訪者平均睡眠時間<=9.575小時

8 定量變數的敘述性統計 > quantile(sleepHR1,0.25) # Q1=25百分位數 25% 7 > quantile(sleepHR1,0.50) # Q2=50百分位數 50% 7.8 > quantile(sleepHR1,0.75) # Q3=75百分位數 75% 8.5

9 將敘述統計製作表格 受測者(n=50) 睡眠時間(單位:小時) 平均值±標準差(mean±SD) 7.78±1.15 中位數(median)
受測者(n=50) 睡眠時間(單位:小時) 平均值±標準差(mean±SD) 7.78±1.15 中位數(median) 7.80 最小值~最大值(min ~ max) 第5個百分位 6.15 第25個百分位 7.00 第50個百分位 第75個百分位 8.50 第95個百分位 9.58

10 tapply語法 tapply(連續變項, 類別變項, 函數)

11 定量變數分組的敘述性統計 > table(sex) # 性別的次數分配 (0:女生1:男生) sex > tapply(sleepHR1,sex,summary) $`0` Min. 1st Qu. Median Mean 3rd Qu. Max $`1`

12 定量變數分組的敘述性統計 > tapply(sleepHR1,sex,sd) > tapply(sleepHR1,sex,quantile,c(0.05,0.25,0.5,0.75,0.95)) $`0` 5% 25% 50% 75% 95% $`1` 5% 25% 50% 75% 95%

13 將分組的敘述統計製作表格 女性(n=28) 男性(n=22) 現在睡眠小時(單位:小時) 平均值±標準差(mean±SD)
女性(n=28) 男性(n=22) 現在睡眠小時(單位:小時) 平均值±標準差(mean±SD) 8.06±1.09 7.42±1.14 中位數(median) 8.00 7.65 最小值-最大值(min-max) 第5個百分位 6.40 5.53 第25個百分位 7.30 6.80 第50個百分位 第75個百分位 8.80 7.90 第95個百分位 9.63 8.50

14 分組的敘述統計的解釋 針對28位女性(sex=0),睡眠時間的平均值(Mean)為8.06小時、標準差(Std. Dev)為1.09、中位數(Median)為8小時、最小值為6.2小時、最大值為10.8小時。 針對22位男性(sex=1),睡眠時間平均值(Mean)為7.42小時、標準差(Std. Dev)為1.14、中位數(Median)為7.65小時、最小值為5小時、最大值為10.5小時。 根據百分位數的結果,女性睡眠時間的第5個百分位為6.40小時,表示有5%的女性睡眠時間小於等於6.40小時,有95%的女性睡眠時間大於6.40小時;其它的百分位的解釋,依此類推。

15 定性變數的敘述性統計 職場壓力(pressuID)為一個二元的類別變數(dichotomous categorical variable)
將壓力程度分為有壓力(pressuID=1)及沒有壓力(pressuID=0) 可以利用次數分配表中的個數及百分比來呈現職場壓力程度的分布。

16 定性變數的敘述性統計 > library(prettyR) # 引入套件prettyR > freq(pressuID)
Frequencies for pressuID NA % %!NA

17 將敘述統計製作表格 沒有職場壓力(pressuID=0)有17位(34%),有職場壓力(pressuID=1)有33位(66%)。
Frequency 次數 Percent 百分比 Cumulative 累積次數 累積百分比 0 無壓力 17 34 1 有壓力 33 66 50 100 沒有職場壓力(pressuID=0)有17位(34%),有職場壓力(pressuID=1)有33位(66%)。

18 xtab語法 Crosstabulates variables with small numbers of unique values.
xtab(formula,data)

19 定性變數分組的敘述性統計 > xtab(pressuID~sex,data=sleepdata) Crosstabulation of pressuID by sex Sex pressuID # 觀察次數 # 列百分比 # 行百分比 odds ratio = 2.55 # 勝算比 relative risk (pressuID-1) = 1.75 # 相對風險

20 將分組的敘述統計製作表格 28位女性中有16位(57.1%)有職場壓力,而22位男性中有17位(77.3%)有職場壓力。 女性(n=28)
女性(n=28) 人數(%) 男性(n=22) 職場壓力 12 (42.9) 5 (22.7) 16 (57.1) 17 (77.3) 28位女性中有16位(57.1%)有職場壓力,而22位男性中有17位(77.3%)有職場壓力。

21 付出最多的人,也是收穫最多的人 ~共勉之~


Download ppt "R教學 單元5 敘述統計 羅琪老師."

Similar presentations


Ads by Google