R教學 單元5 敘述統計 羅琪老師.

Slides:



Advertisements
Similar presentations
手工加工全框眼镜技术 前调整确定加工基准制作模板割边 磨边磨安全角 (抛光) 装配 后调整检测.
Advertisements

融资融券业务的保证金与保证金比例 光大证券 · 信用业务管理总部 2015 年 12 月 ★融资融券业务投资者教育活动材料★
洞庭月,衡岳云,巫山雨, 波撼气蒸,揽天下风光,堪 称独步; 崔灏诗,范相记,王勃序, 两楼一阁,数江南文物,各 有千秋。
道家養生保健長壽藥膳 藥膳應用原則: 天人相應,道法自然 藥膳有兩個職能: 一是保健增壽,一是治療疾病。 ◎ 黃蕙棻.
《公路纵断面设计》 —— 纵断面设计的要求 道桥系 二○○七年五月. 纵断面设计的一般要求 1 .纵坡设计必须满足《公路工程技术标准》中的各项规定。 2 .为保证汽车能以一定的车速安全舒顺地行驶,纵坡应具有 — 定 的平顺性,起伏不宜过大及过于频繁。尽量避免采用极限纵坡 值.缓和坡段应自然地配合地形设置,在连续采用极限长度的.
什么是遗传病? 它与非遗传病 如何区别 遗传病:是由引起 遗传病:是由遗传物质改变引起 的或者是由所控制的人 类疾病. 的或者是由致病基因所控制的人 类疾病.基因 遗传病的概念.
第二节 脉搏的评估及异 常时的护理. 教学目标  1 、解释有关名词  2 、说出脉搏、呼吸的正常值  3 、叙述脉搏、呼吸的测量方法;识别脉搏、 呼吸的异常变化  4 、叙述测量脉搏、呼吸的注意事项  5 、正确记录脉搏、呼吸,做到认真负责,实 事求是。
项目四、腻子的施工  一、准备工作  二、安全与卫生  三、板件表面的处理  四、准备腻子  五、刮腻子  六、腻子的干燥  七、腻子的打磨  结束.
冷 热 疗 法.
個人理財規劃 第八章 投資規劃.
保育员工作职责.
因为我们年轻所以我们执着 因为我们是戴中教师所以我们更加努力
第41课 公民的财产权 .
开天门 梅州市中医医院 郑雪辉.
小儿斜颈的诊断与治疗.
政府採購法規概要 報告人:杜國正 行政院公共工程委員會企劃處.
中式面点技艺 长春市商业职业技术学校 王成贵 中式面点技艺 长春市商业职业技术学校 授课教师: 王 成 贵.
小学语文常用说明方法 广州市越秀区云山小学 高年级 李晓泓.
消防安全知识讲座 ---校园防火与逃生 保卫科.
校园信息管理系统 河北科技大学网络中心 2000/4/10.
R教學 單元3 建立新變數及函數的介紹 羅琪老師.
之 魔 析 妖 鬼 解 怪 大 沈家仪小组出品.
第四讲 组织结构与人员配置 复旦大学管理学院 芮明杰教授
第2节 分析综合.
古文明中的直角三角形.
第三章 儿童少年、女子及 中老年的体育卫生 第一节 儿童少年的体育卫生
九十四年度社區腎臟保健推廣 成果報告 財團法人彰化基督教醫院 楊郁 醫師.
301——隆重登场.
拉萨属高原温带半干旱季风气候,平均海拔3658米,年日照3000多小时,素有“日光城”、“太阳城”的美誉。年最高气温29℃,最低气温零下16
学生学业水平诊断与提升策略探究 平阳中学 周秀丽.
课堂回顾 1、继承与发展的关系及处理 关系:继承是发展的必要前提,发展是继承的必然要求。继承与发展,是同一个过程的两个方面。文化在继承的基础上发展,在发展的过程中继承。 文化在继承中发展 处理:把握好文化继承与发展的关系,批判地继承传统文化,不断推陈出新,革故鼎新,我们就能够作出正确的文化选择,成为自觉地文化传承者和享用者。
第16课时 放飞理想 立志成才 考 纲 内 容 要 点 探 究 考 点 解 读.
征服火灾是全社会的事业,它需要科技的进步,需要消防监督,也需要消防科学知识的普及和提高。通过各类的消防安全培训,从而使人们更好的掌握消防常识和了解消防法规,提高消防安全意识,提高自防自救能力,使我们的生产和生活远离火灾的侵袭。
徵收苗栗市福全段147、1588及文心段10、11地號等4筆土地之
形神兼备,写活人物 ——外貌描写写作指导 丰县华山初级中学 王艳丽.
歷史的耶穌 普通話學人之家 June 21, 2003.
医学统计学 8 主讲人 陶育纯 医学统计学 8 主讲人 陶育纯
2016中重卡网络规划 中重卡营销部 2016年6月.
讲 义 大家好!根据局领导的指示,在局会计科和各业务科室的安排下,我给各位简要介绍支付中心的工作职能和集中支付的业务流程。这样使我们之间沟通更融洽,便于我们为预算单位提供更优质的服务。 下面我主要从三方面介绍集中支付业务,一是网上支付系统,二是集中支付业务流程及规定等,
足球運動情報蒐集與分析 趙榮瑞 教授.
揭秘 庄家 股市中的 为什么你的股票一买就跌,一卖就涨? 为什么出了利好,股价反而下跌? 为什么有的股票一直涨停?
講師:賴玉珊 心理師 證照:諮商心理師(諮心字第001495號) 學歷:國立台南大學諮商與輔導研究所 畢 現任:長榮大學諮商中心專任心理師
中国人民公安大学经费管理办法(试行) 第一章总则 第四条:“一支笔” “一支笔”--仅指单位主要负责人。负责对本 单位的经费进行审核审批。
二、汽化和液化.
复习: 一、细胞膜的成分 1、脂质 2、蛋白质 3、糖类 二、生物膜的功能: 1、界膜 2、控制物质的进出 3、进行细胞间信息交流.
第九章 长期资产及摊销 2017/3/21.
第1节人体内物质的运输 人体的组织细胞每时每刻都需要营养物质和氧,并不断产生二氧化碳、尿素等废物。这些物质在人体内运输主要依靠 系统。人体的血液循环系统由 、 和 组成。 血液循环 血管 心脏 血液.
新疆自治区“十二五”科技发展 规划编制工作
世界的物质性 人类社会也是物质的 自然界是物质的 从古猿到人的进化中脑量的变化
第3节 以水为主要传热介质 的烹调方法.
乳猪断奶后拉稀,掉膘与教槽料.
第二单元 文化传承与创新.
政治常识 第一课 我国的国家制度(上) 第4课时 政体及其与国体的关系.
第一章 汽车的解体与清洗 第一节 汽车解体工艺 一、零件的拆卸原则 1、拆卸前应熟悉被拆总成的结构
Chapter 2 第二章 Presenting Data in Tables and Charts 統計圖及表的應用
類別資料分析(Categorical Data Analysis)
Logistic Regression Appiled Linear Statistical Models,由Neter等著
啟示錄 人 子 七 教 會 寶 座 七 印 七 號 龍 與 獸 七 碗 巴 比 倫 千 禧 年 前 後 新 耶 路 撒 冷 第9章(第5號)
網路遊戲版 幸福農場168號.
Homework 1(1/2) 本頁表格為派密(Peavy)在07年球季各場次ERA的表現,(1)請依此數據完成下頁表格之統計值並說明之;(2)並與其他三名投手之統計值比較之。(請詳述計算過程) 場次 各場次ERA
評分標準.
微信商城系统操作说明 色卡会智能门店.
17 無母數統計檢定  學習目的.
新媒体环保公益广告现状调查及发展潜力研究
單元2 範例介紹、資料型態與資料讀取 羅琪老師
大綱 一.受試者之禮券/禮品所得稅規範 二.範例介紹 三.自主管理 四.財務室提醒.
台灣房價指數 台灣房屋 中央大學 2011年7月29日.
分類樹(Classification Tree)探討Baseball Data
SAS 統計程序實作 PROC MEANS (一個母體)
Presentation transcript:

R教學 單元5 敘述統計 羅琪老師

敘述性統計量 針對定量資料,可以利用平均數、中位數及眾數等來瞭解資料的集中趨勢,利用標準差、四分位距及全距等來了解資料的分散程度,也可以藉著最大值及最小值來看資料的分布是否介在合理的範圍內,還是有輸入錯誤等問題。 針對定性資料,則常以個數及百分比來表示資料的分布情形。

變數的命名 填表日:民國(v_y)年(v_m)月(v_d)日 姓名(name): ___________ 流水號(id) 睡眠與壓力調查 填表日:民國(v_y)年(v_m)月(v_d)日 姓名(name): ___________ 性別(sex): _____ 0:女 1: 男 出生年月日: 民國(b_y)年(b_m)月(b_d)日 身高(height): _____ 公分 體重(weight): _____ 公斤 壓力有無(pressuID):____ 0: 無 1: 有 壓力程度(pressure):____ 0: 無 1: 中等 2: 大 最近兩個月平均睡眠時間(sleepHR1):___小時 (取自小數點第一位) 請回憶兩個月前之平均睡眠時間(sleepHR0):___小時 (取自小數點第一位) 最近兩個月是否有睡眠困擾問題(sleepTR1):___0: 無 1: 有 請回憶兩個月前是否有睡眠困擾問題(sleepTR0):___ 0: 無 1: 有 最近兩個月的睡眠品質(sleepQOL):___ 1:很不好 2:不好 3:普通 4:好 5:很好

資料讀取 最近兩個月平均睡眠時間(sleepHR1,單位:小時)為連續變數故可求其平均值、標準差、百分位數…等。 > sleepdata<-read.csv("c:/RData/sleepdata.csv",header=T) > sleepdata > attach(sleepdata) 最近兩個月平均睡眠時間(sleepHR1,單位:小時)為連續變數故可求其平均值、標準差、百分位數…等。

sleepdata資料檔 id v_y v_m v_d name sex b_y b_m b_d height weight pressuID pressure sleepHR1 sleepHR0 sleepTR1 sleepTR0 sleepQOL 1 97 25 Java 66 12 161.5 65 8.5 8.7 3 2 Alice 58 5 6 154.5 55 7.3 7.4 4 June 174.6 70 7 7.5 Jack 64 164 42 7.9 Jacoby 49 24 150 50 6.8 6.1 Peter 20 162 63 6.3 48 Kalare 72 176 9.3 Jame 73 9 28 155 45 8.9 Andy 67 10 7.7

定量變數的敘述性統計 > summary(sleepHR1) Min. 1st Qu. Median Mean 3rd Qu. Max. 5.00 7.00 7.80 7.78 8.50 10.80 最近兩個月平均睡眠時間的平均數為7.78小時, 中位數為7.80小時 > sd(sleepHR1) # 標準差 [1] 1.14838 最近兩個月平均睡眠時間的標準差為1.14838小時

定量變數的敘述性統計 > quantile(sleepHR1,0.05) # 5百分位數 5% 6.145 最近兩個月有5%的受訪者平均睡眠時間<=6.145小時 > quantile(sleepHR1,0.95) # 95百分位數 95% 9.575 最近兩個月有95%的受訪者平均睡眠時間<=9.575小時

定量變數的敘述性統計 > quantile(sleepHR1,0.25) # Q1=25百分位數 25% 7 > quantile(sleepHR1,0.50) # Q2=50百分位數 50% 7.8 > quantile(sleepHR1,0.75) # Q3=75百分位數 75% 8.5

將敘述統計製作表格 受測者(n=50) 睡眠時間(單位:小時) 平均值±標準差(mean±SD) 7.78±1.15 中位數(median)   受測者(n=50) 睡眠時間(單位:小時) 平均值±標準差(mean±SD) 7.78±1.15 中位數(median) 7.80 最小值~最大值(min ~ max) 5.00-10.80 第5個百分位 6.15 第25個百分位 7.00 第50個百分位 第75個百分位 8.50 第95個百分位 9.58

tapply語法 tapply(連續變項, 類別變項, 函數)

定量變數分組的敘述性統計 > table(sex) # 性別的次數分配 (0:女生1:男生) sex 0 1 28 22 > tapply(sleepHR1,sex,summary) $`0` Min. 1st Qu. Median Mean 3rd Qu. Max. 6.200 7.300 8.000 8.064 8.750 10.800 $`1` 5.000 6.800 7.650 7.418 7.900 10.500

定量變數分組的敘述性統計 > tapply(sleepHR1,sex,sd) 0 1 1.089415 1.142944 > tapply(sleepHR1,sex,quantile,c(0.05,0.25,0.5,0.75,0.95)) $`0` 5% 25% 50% 75% 95% 6.400 7.300 8.000 8.750 9.625 $`1` 5% 25% 50% 75% 95% 5.53 6.80 7.65 7.90 8.50

將分組的敘述統計製作表格 女性(n=28) 男性(n=22) 現在睡眠小時(單位:小時) 平均值±標準差(mean±SD)   女性(n=28) 男性(n=22) 現在睡眠小時(單位:小時) 平均值±標準差(mean±SD) 8.06±1.09 7.42±1.14 中位數(median) 8.00 7.65 最小值-最大值(min-max) 6.20-10.80 5.00-10.50 第5個百分位 6.40 5.53 第25個百分位 7.30 6.80 第50個百分位 第75個百分位 8.80 7.90 第95個百分位 9.63 8.50

分組的敘述統計的解釋 針對28位女性(sex=0),睡眠時間的平均值(Mean)為8.06小時、標準差(Std. Dev)為1.09、中位數(Median)為8小時、最小值為6.2小時、最大值為10.8小時。 針對22位男性(sex=1),睡眠時間平均值(Mean)為7.42小時、標準差(Std. Dev)為1.14、中位數(Median)為7.65小時、最小值為5小時、最大值為10.5小時。 根據百分位數的結果,女性睡眠時間的第5個百分位為6.40小時,表示有5%的女性睡眠時間小於等於6.40小時,有95%的女性睡眠時間大於6.40小時;其它的百分位的解釋,依此類推。

定性變數的敘述性統計 職場壓力(pressuID)為一個二元的類別變數(dichotomous categorical variable) 將壓力程度分為有壓力(pressuID=1)及沒有壓力(pressuID=0) 可以利用次數分配表中的個數及百分比來呈現職場壓力程度的分布。

定性變數的敘述性統計 > library(prettyR) # 引入套件prettyR > freq(pressuID) Frequencies for pressuID 1 0 NA 33 17 0 % 66 34 0 %!NA 66 34

將敘述統計製作表格 沒有職場壓力(pressuID=0)有17位(34%),有職場壓力(pressuID=1)有33位(66%)。 Frequency 次數 Percent 百分比 Cumulative 累積次數 累積百分比 0 無壓力 17 34 1 有壓力 33 66 50 100 沒有職場壓力(pressuID=0)有17位(34%),有職場壓力(pressuID=1)有33位(66%)。

xtab語法 Crosstabulates variables with small numbers of unique values. xtab(formula,data)

定性變數分組的敘述性統計 > xtab(pressuID~sex,data=sleepdata) Crosstabulation of pressuID by sex Sex pressuID 0 1 0 12 5 17 # 觀察次數 70.59 29.41 - # 列百分比 42.86 22.73 34.00 # 行百分比 1 16 17 33 48.48 51.52 - 57.14 77.27 66.00 28 22 50 56 44 100 odds ratio = 2.55 # 勝算比 relative risk (pressuID-1) = 1.75 # 相對風險

將分組的敘述統計製作表格 28位女性中有16位(57.1%)有職場壓力,而22位男性中有17位(77.3%)有職場壓力。 女性(n=28)   女性(n=28) 人數(%) 男性(n=22) 職場壓力 無 12 (42.9) 5 (22.7) 有 16 (57.1) 17 (77.3) 28位女性中有16位(57.1%)有職場壓力,而22位男性中有17位(77.3%)有職場壓力。

付出最多的人,也是收穫最多的人 ~共勉之~