生物統計與SAS軟體課程教學(二) 單變項描述 (Descriptive Statistics)

Slides:



Advertisements
Similar presentations
單元九:單因子變異數分析.
Advertisements

Ch12 資料分析.
資料分析 ---敘述統計分析.
樞紐分析與資料庫 蕭世斌 Nov 20, 2010.
Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心
Measures of location and dispersion
第一章 生物统计学基本知识 1、明确统计在做什么事情、将用什么样的方式去做。 2、生物统计与统计学的关系,其涉及哪些内容 1.
8+2-3=? 統計 吳函儒、李雅芳 吳秉蓉、王農景 - =
單元四:資料的描述(二) ㄧ、集中趨勢統計量數 二、分散程度統計量數.
二、以圖表描述資料 2. Charts & Graphs.
統計學 郭信霖 許淑卿.
數 據 分 析 林煜家 魏韶寬 陳思羽 邱振源.
統計軟體工作坊 輕鬆學會統計軟體R 2013/05/16.
Chapter 3 第三章 Numerical Descriptive Measures 數值量測及資料描述
3.1 集中趋势的度量 3.2 离散程度的度量 3.3 偏态与峰态的度量
第一章.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
統計學 授課教師:林志偉 Tel:5021.
Chap3 Descriptive statistics -numerical measures Minitab & Excel
第十四章 数值变量的统计描述.
第二章 SAS的描述统计功能 2.1 描述性统计的基本概念 2.2 在SAS中计算统计量 2.3 统计图形.
第 3 章 敘述統計:數值方法.
點狀圖 (Dot Plot).
第 5 章 樣本資料的數值分布.
Chapter 2 第二章 Presenting Data in Tables and Charts 統計圖及表的應用
邏輯迴歸 Logistic Regression
Chapter 2 頻率分配.
第一章 敘述統計學.
第 4 章 分散量數.
敘述統計 2.1 次數分配 2.2 統計量數 個案:樣本敘述 商管研究資料分析SPSS的應用 Chapter 2 敘述統計.
介紹SPSS SPSS 本為 Statistical Package for the Social Sciences 的簡寫,由於產品及功能不斷地擴充,目前改名成 Statistical Product and Service Solutions。
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
敍述統計學 許明宗.
第 3 章 敘述統計II:數值方法 Part A (3.1~3.2).
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
第一次上統計Tutorial 就上手 不是只有上一次嗎.
表達及陳列統計資料 統計圖表 統計量數 次數分配表 直方圖 次數多邊圖 累加次數圖 條形圖 圓形比例圖 集中量數 變異量數或離散量數
敘述統計I:表格與圖形法 Part A ( ) 第 2 章 敘述統計I:表格與圖形法 Part A ( )
描述性统计学 作者 Dr. Maria Correa-Prisant 翻译 lvruiqin(DXY)
第3章 變異量數與分佈形狀.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第七章 调查数据的分析 第一节 数据集中趋势的测定 第二节 数据离散程度的测定 第三节 动态数据的分析 第四节 相关与回归分析.
EXCEL+ORIGN+SPSS的描述统计
資料整理與次數分配 Organizing Data 社會統計(上).
信度分析 (11/7~11/13) 1.何謂『信度』 2.信度分析步驟.
Homework 1(1/2) 本頁表格為派密(Peavy)在07年球季各場次ERA的表現,(1)請依此數據完成下頁表格之統計值並說明之;(2)並與其他三名投手之統計值比較之。(請詳述計算過程) 場次 各場次ERA
Dr. C. Hsieh College of Informatics Kao yuan University
Chapter 5 z-Scores.
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
楊志強 博士 統計學 楊志強 博士
第三章 敘述統計量.
Review of Statistics.
Ogive plot example 說明者:吳東陽 2003/10/10.
Chapter 4 Variability 離散趨勢測量 2019/4/26.
電子期刊使用統計 CONCERT 2002 meeting November 13-14, 2002 羅宙康 Springer-Verlag
(四)标准差(standard deviation)
楊志強 博士 統計學 楊志強 博士
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
第二章 次數分配表與統計圖 第一節 次數分配表的製作 第二節 統計圖的製作 第三節 次數分配的形狀和性質 第四節 電腦習作.
第十四章名義資料的數字 描述:關連測量 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
第四章 統計資料的整理:統計量數.
課程三 描述統計:次數分配、中央趨勢.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
生物统计学 Biostatistics 第一章 统计数据的收集与整理
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
描述統計 Descriptive Statistics
11621 : Small Factors ★★☆☆☆ 題組:Problem Set Archive with Online Judge
Presentation transcript:

生物統計與SAS軟體課程教學(二) 單變項描述 (Descriptive Statistics) 台大衛生政策與管理研究所 江宜珍 2005.1.15

課程宗旨 著重於描述性統計,瞭解各種變項類型所適用的單變項分析方法 介紹SAS視窗及基本功能 資料管理步驟及程式語法 單變項描述之語法及報表解讀

使用目的及時機 瞭解資料的分佈情形 Check data, clean data 有許多方法可供選擇,但要選對方法!! 有助於瞭解資料的樣貌 提供選擇後續統計分析方法的依據 對重要變項做基本的描述 Check data, clean data 極端值(outlier) 除錯:不合邏輯的值 有許多方法可供選擇,但要選對方法!!

等距&比例變項 「等距」意指每個數值的間隔相等,即「1與2的差別」和「101與102的差別」相同,亦即每個單位都是一樣大小(ex.身高、體重、收入、生病次數、住院人數、溫度) 「比例變項」又稱為「等比變項」,為等距變項中,具有絕對的「0」(真正的0)的變項!(ex.身高、體重、收入、生病次數、住院人數),意即包含了「沒有」者,因此可以計算倍數 「溫度」則不是!因為0℃是武斷給予的,所以不能說0℃是「沒有溫度」,且40℃也非20℃的兩倍熱 通常此種變項所具有的訊息最豐富、最詳細 最高級的變項,亦可轉換成其他級的變項

等距變項的描述1 資料的集中趨勢 資料的離散趨勢 又稱為資料的「趨中性」、「中央趨勢」 目的是找出最具代表性的數值來代表全部個體 又稱為資料的「變異性」

等距變項的描述2 — 集中趨勢 平均值(Mean) 中位數(Median) 又稱為「中間值」 母全體 樣本 母全體 樣本 特色:每個個體的數值 均包括在內、每個個體 的數值所佔份量(對平均 值的影響)均等 缺點:易受極端值影響,若資料有許多極端值時,以平均值代表全體的集中趨勢會有問題 中位數(Median) 又稱為「中間值」 即將全部個體的數值,由最小排至最大,位於最中間的那個數值就是中位數(若為樣本數為偶數,則將中間兩個個體的數值相加÷2) 優點:不會受極端值影響,若資料有許多極端值時,以中位數較能代表全體數值的集中趨勢

等距變項的描述3 — 離散趨勢 最大值(Maximum)、最小值(Minimun) 差距(range)=最大值-最小值 ex. A組資料最大值為95、最小值為5,則差距為90 B組資料最大值為60、最小值為40,則差距為20 A組資料的變異性>B組資料的變異性 但僅以差距來描述資料的變異性並非理想,因為只以最大值及最小值兩個數值來決定,若兩個資料的差距相等,不等於變異性(離散情形)相同

等距變項的描述4 — 離散趨勢 變異數(Variance) 標準差(Standard Deviation) 母全體的變異數 樣本的變異數 母全體的變異數 樣本的變異數 即每個數值減平均值後,以平方的方式去除負值,再將全部平方值相加,除以個案數 標準差(Standard Deviation) 即變異數開平方根 因為母群的變異情形大,樣本的變異情形小,所以要調整樣本的標準差使其可代表母群

等距變項的描述5 — 離散趨勢 變異係數(Coefficient of variance,C.V.) 以「標準差」除以「平均值」,通常會以%表示 即 或 目的在比較兩種不同變項的變異情形,以此方法可以去除因變項「測量單位」不同的情形,即是比較各變項的標準差是平均值的多少%,CV值越大表示該變項的變異性(離散情形)越大 ex.想知道全班同學的「身高」變異較大還是「體重」變異較大

序位或類別變項的描述 頻率(frequency) 眾數(Mode) 每個數值的出現次數 又稱為流行值 在資料中出現頻率最多的數值,即最多個案為此數值

畫圖 次數分佈圖:通常以變項為x軸、次數(人數)為y軸 等距變項 序位或類別變項 連續性的直方圖(histogram,或稱長條圖) 需先將等距變項分組,依據每個組距中出現的次數畫圖 可檢視是否呈現「常態分佈」 可在圖中標出最大值、最小值、中位數、眾數 枝葉圖(stem-and-leaf plot) 盒狀圖(box plot) 可在圖中標出最大值、最小值、中位數、上四分位數、下四分位數、極端值(outlier) 序位或類別變項 棒狀圖(bar chart, bar graph) 因為變項非為連續變項,所以 x軸所列的變項次序可以交換,但不可將 x軸的變項連接起來

盒狀圖

枝葉圖 & 盒狀圖

常態分佈1 等距變項的分佈多呈現「常態分佈(Normal Distribution)」 越接近平均值,個案數越多or頻率越高 曲線分佈圖呈現鐘型對稱(Gausian shape, symmetric),即「>平均值」和「<平均值」的個案數各佔50% 平均值、中位數、眾數為同一數值

常態分佈2 由「平均值」決定曲線的中央位置,「標準差」來決定平均值兩旁曲線的伸展及變異情形 mean = median = mode

非常態分佈1— 偏右分佈(positively skewed) mean > median > mode

非常態分佈2— 偏左分佈(negatively skewed) mean < median < mode

非常態分佈3— 雙峰分佈(bimodal distribution)

~謝謝大家的耐心聆聽嚕~