統計軟體工作坊 輕鬆學會統計軟體R 2013/05/16.

Slides:



Advertisements
Similar presentations
第四週課程 1 (10/10~10/16) 如何建立資料. 原始資料範例 a1~a5 表示選擇題,輸入原始答案,如 A 、B、C、D b1~b5 表示填充題, c1~c5 表示計算題,輸入得分.
Advertisements

第一單元 建立java 程式.
資料整理與圖表編製 內容說明: 教師與學生互動練習,熟習資料整理 與圖表編製。.
資料整理與圖表編製 內容說明: 教師與學生互動練習,熟習資料整理與圖表編製。.
第六章 统计表与统计图 第一节 统计表 第二节 统计图 1.
Ch12 資料分析.
資料分析 ---敘述統計分析.
統 計 程 式 語 言.
Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心
Measures of location and dispersion
Keller: Stats for Mgmt & Econ, 7th Ed 圖表敘述法
二、以圖表描述資料 2. Charts & Graphs.
參考書籍:林惠玲與陳正倉(2002),應用統計學(第二版)。台北:雙葉書廊有限公司。
統計學 郭信霖 許淑卿.
數 據 分 析 林煜家 魏韶寬 陳思羽 邱振源.
Chapter 3 第三章 Numerical Descriptive Measures 數值量測及資料描述
医学统计学 主讲人:信息部 林雪君.
第一章.
統計學 授課教師:林志偉 Tel:5021.
Chap3 Descriptive statistics -numerical measures Minitab & Excel
Descriptive statistics
第3章 資料的整理與表現- 統計表與統計圖.
第二章 SAS的描述统计功能 2.1 描述性统计的基本概念 2.2 在SAS中计算统计量 2.3 统计图形.
第 3 章 敘述統計:數值方法.
點狀圖 (Dot Plot).
第 5 章 樣本資料的數值分布.
Chapter 2 第二章 Presenting Data in Tables and Charts 統計圖及表的應用
Chapter 2 頻率分配.
STATA 7 蘇國賢.
類別(class) 類別class與物件object.
MINITAB基本操作 說明者:吳東陽          2003/09/30.
R教學 安裝RStudio 羅琪老師.
第一章 敘述統計學.
統計基本觀念 壹、資料 資料來源:實驗之量測結果,抽樣調查結果,公告資料。 一、資料類型
圖表製作 集中指標 0628 統計學.
安裝JDK 安裝Eclipse Eclipse 中文化
自由軟體介紹(一) 把flash通通帶回家 報告人:陳俊銘.
第 4 章 分散量數.
介紹SPSS SPSS 本為 Statistical Package for the Social Sciences 的簡寫,由於產品及功能不斷地擴充,目前改名成 Statistical Product and Service Solutions。
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
敍述統計學 許明宗.
第 3 章 敘述統計II:數值方法 Part A (3.1~3.2).
私立南山高中 信息組 電腦研習 電腦資料的備份 中華民國 99年4月20日 星期二.
第一單元 建立java 程式.
第一次上統計Tutorial 就上手 不是只有上一次嗎.
表達及陳列統計資料 統計圖表 統計量數 次數分配表 直方圖 次數多邊圖 累加次數圖 條形圖 圓形比例圖 集中量數 變異量數或離散量數
敘述統計I:表格與圖形法 Part A ( ) 第 2 章 敘述統計I:表格與圖形法 Part A ( )
本章學習目標 學習極座標繪圖與對數繪圖 學習雙y軸繪圖 學習向量場繪圖 學習統計繪圖 在Matlab的環境裡製作動畫
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
EXCEL+ORIGN+SPSS的描述统计
信度分析 (11/7~11/13) 1.何謂『信度』 2.信度分析步驟.
Dr. C. Hsieh College of Informatics Kao yuan University
Chapter 5 z-Scores.
楊志強 博士 統計學 楊志強 博士
FTP使用教學 簡介: 軟體名稱:FileZilla 軟體性質:Freeware 版本: 繁體中文版
Review of Statistics.
Ogive plot example 說明者:吳東陽 2003/10/10.
Chapter 4 Variability 離散趨勢測量 2019/4/26.
楊志強 博士 統計學 楊志強 博士
第十四章名義資料的數字 描述:關連測量 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
第四章 統計資料的整理:統計量數.
生物统计学 Biostatistics 第一章 统计数据的收集与整理
安裝JDK 配置windows win7 環境變數
Cloud Training Material- 事件 Sherman Wang
Programming & Language Telling the computer what to do
開發Java程式語言的工具 JDK.
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
Statistical Table and Statistical Graph
InputStreamReader Console Scanner
Presentation transcript:

統計軟體工作坊 輕鬆學會統計軟體R 2013/05/16

R簡介 可進行資料處理、統計分析、科學計算與圖形繪製 適用各種作業系統:Windows, Unix, Linix, MacOS 開放原始碼的自由軟體(open source) 免費:可由the Comprehensive R Archive Network (CRAN)下載 藉由套件(package)可不斷增加其功能 可與其他程式(C, Matlab, WinBugs,…)連結使用 超過27個國家,66個連結點

R的歷史 S1 1976–1980 Honeywell GCOS, FORTRAN-based S2 1980–1988 1981–1986 1984– Unix: macros, interface language QPE (Quantitative programming environment) general outside licensing, books S3 1988–1993 C-based, S functions & objects S4 Programming with data R 1993 First binary copies of R on Statlib 2000 R 1.0.0 released Kurt Hornik (2008) “The Past, Present, and Future of the R Project” John Chambers (2006) “A History of S and R”

下載R軟體 Go to this web page http://www.r-project.org/

下載R軟體 點選CRAN,接著選擇下載點

下載R軟體 根據作業系統選擇下載的版本 選擇“base”

下載R軟體 下載並安裝 安裝之後在桌面會出現捷徑

R視窗說明 停止運算 載入工作頁面 複製及貼上 Toolbar R Console 主要視窗

定義新物件 定義一個新的變數叫temp,並且指定其值為24 紅字是輸入,藍字是輸出 大小寫代表不同物件 箭頭(<-)可用“=”代替 物件名稱必須為字母開頭,其餘位置可以是數字或 點 c, q, t, C, D, F, I, T; diff, df, pt, pi, …不可以是物件名稱

R as a calculator 可以直接輸入數值計算 若物件屬性與維度相同, 可以進行四則運算 常用的數學函數,如log, exp, sin,..可直接計算 若不能計算,會回傳NaN (not a number)

輸入向量 c(…) 可以是數值 可以是字串 還可以把每一個元素取名字

Practice Weight: 50, 62, 47, 48, 72, 81, 45, 58, 65, 55 Height: 1.58, 1.77, 1.43, 1.52, 1.84, 1.72, 1.45, 1.62, 1.70, 1.55 請計算每個人的BMI及平均BMI

查詢、移除已定義物件 ls() rm(“A”) rm(list=ls())

利用R的記事本寫指令 開啟記事本 儲存記事本

更改工作目錄 改變檔案及資料的存放位置

下載R套件 練習:請下載R Commander套件 “Rcmdr”

載入R套件 可在R Console視窗中輸入library(“Rcmdr”) 或者由選單中點選

學生生活型態調查 班級 ( class): (1)統資系 (2)財數系 (3)其他 性別 (sex): (1) 女生 (2)男生 身高 (high) 體重 (weight) 血型 (blood): (1)A (2)B (3)O (4) AB 住宿地 (location): (1)宿舍 (2)學校附近 (3)東海別墅附近 (4)家裡 (5) 其他 住宿費用 (rent):(1) 3000以下 (2) 3000~4000 (3)4000~5000 (4)5000~6000 (5)6000~ (6)其他 上學方式 (way): (1)走路 (2)騎機車 (3)搭校車 (4)搭公車 (5) 其他

資料輸入 輸入新資料 按一下var1,會出現變數編輯器,輸入變數名稱後,再按Enter即可。 輸入資料後關閉視窗即可

資料輸入 匯入資料

練習 請讀入EXCEL檔案“class-demo”,並將其命名為 data2 請更改data2中,變數class、sex為character

資料型態 類別資料 序位資料 等級化資料 離散型資料 連續型資料 可以用數字代表類別,但數字本 身沒有意義 男生=1,女生=0 序位資料 類別的大小次序有意義,但順序 的運算無意義 原位癌=0,癌症第一期=1,癌症第 二期=2,第三期=3,第四期=4 等級化資料 根據不同類別的觀察值排序,給 予類別不同的名次 象、牛、熊、獅 離散型資料 數值為真正測量值而非 代號 每學期進圖書館次數 連續型資料 數值為真正觀測值,測 量值不限定為整數 每星期唸書的時間

資料的整理 初步的組織、歸納觀察到的資料 統計表:製表是整理資料最簡單且最常用的方 法 統計圖 次數分配表(frequency table)、相對次數分配表 (relative frequency table)、累積相對次數分配表 (cumulative relative frequency table) 統計圖 長條圖(bar chart)、直方圖(histogram)、次數多邊圖 (frequency polygon)、散佈圖(scatter plot)、盒形圖 (box plot)、線圖(line graph)

統計表 次數分配表:記錄每個組 別中觀察到的個體數 相對次數分配表:記錄每 一組別人數/總觀察人數 NOTE:一個個體只會分屬於一個類別 1. 處理離散型或連續型資料為次數分配表時,需將資料區分為一系列沒有重疊且明確的組別。 2. 分組之前要先定組限與組距,每組組距不一定要相同。 NOTE:一個個體只會分屬於一個類別

統計表 累積相對次數分配表:低於或等於該組上限的 人數/總人數

統計表

長條圖(Bar charts) 常用來表示類別或序位資料 高度代表組別分佈的次數或相對次數

高度代表組別分佈的次數或相對次數,寬度代表組距 直方圖(Histogram) 用來描述離散或連續型的資料分佈 可以觀察資料的分佈狀況與集中趨勢 高度代表組別分佈的次數或相對次數,寬度代表組距 資料是否對稱?左偏?右偏?

散佈圖(scatter plot) 描述兩個不同的連續資料的關係 肺活量與FEV的關係?

盒型圖(box plot) 利用樣本產生之統計量(最小值minimum、第一四 分位數first quartile、中位數median、第三四分位 數third quartile、最大值maximum)來描繪資料的 分佈。 第一四分位數(25%分位數):數值高於或等於全部 觀察值的25%,低於或等於全部觀察值的75% 中位數(50%分位數):位於資料50%的數值 第三四分位數(75%分位數):數值高於或等於全部 觀察值的25%,低於或等於全部觀察值的75%

四分位數(Quartiles) 25th 百分位數 (之前的資料個數大約有25%的資料 總個數&之後個數75%): 例:100/4=25  (第25名+第26名)/2;第25名 例:50/4=12.5  (第12名+第13名)/2; 例:67/4=16.75  (第16名+第17名)/2; 50th 百分位數 (前後各約二分之一的個數): 例:100/2=50  (第50名+第51名)/2;第50名 例:50/2=25  (第25名+第26名)/2;第25名 例:67/2=33.5  (第33名+第34名)/2; 例:40/2=20  (第20名+第21名)/2;第20名

四分位數(Quartiles) 75th 百分位數 (前約四分之三、後約四分之一的 個數): 例:100/4*3=75  (第75名+第76名)/2;第75名 例:50/4*3=37.5  (第37名+第38名)/2; 例:67/4*3=50.25  (第50名+第51名)/2; 例:40/4*3=30  (第30名+第31名)/2;第30名 四分位距(Inter-quartile range, IQR):第三四分位數 減第一四分位數

Box Plot Elements of a Box Plot * o Q1 Q3 Inner Fence Outer Q1-3(IQR) Median Q1 Q3 Inner Fence Outer Interquartile Range Smallest data point not below inner fence Largest data point not exceeding inner fence Suspected outlier Outlier Q1-3(IQR) Q1-1.5(IQR) Q3+1.5(IQR) Q3+3(IQR)

統計圖 這裡可以選要畫的圖形

練習 請計算data2中居住地區之次數分配表 請data2中畫出身高與體重之散布圖

資料摘要(data summary) 利用數字描述資料作量的描述 測量資料的集中趨勢 (measure of central tendency) 平均值(mean)、中位數(median)、眾數(mode) 測量資料的變異情況 (measure of dispersion) 全距(range)、四分位距(IQR)、變異數(variance)和標準 差(standard deviation)

資料摘要(data summary)

練習 請計算data2中體重之平均數、標準差、中位數、 第一四分位數及第三四分位數