Dr. C. Hsieh College of Informatics Kao yuan University

Slides:



Advertisements
Similar presentations
20-Opening 統計學 授課教師:楊維寧 10Simple-R-Commands.
Advertisements

数 理 统 计 华南农业大学理学院应用数学系 Statistics Applied Mathematic Department, College of Sciences, SCAU.
2015 年 4 月 (第一期) 初中数学 14 班 简报 惠州市 2015 年初中教师全员培训.
第十三章 医学统计学方法的基本概念和基本步骤
第二章 语言测试的功能与分类 湖南师范大学外国语学院 邓 杰 教授.
資料分析 ---敘述統計分析.
Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
Measures of location and dispersion
第一章 生物统计学基本知识 1、明确统计在做什么事情、将用什么样的方式去做。 2、生物统计与统计学的关系,其涉及哪些内容 1.
第2章 数据处理基础 2.1数据及数据类型 2.2 数据统计特性 2.3 数据预处理 2.4 相似性度量 据的中心度量
概率论与数理统计 课件制作:应用数学系 概率统计课程组.
第一章 緒論.
8+2-3=? 統計 吳函儒、李雅芳 吳秉蓉、王農景 - =
SPSS统计软件的使用方法基础 主讲人:宋振世 (闵行校区) 电 话:
講員:謝浩明 桃園縣中壢市32054中大路300號 中央大學資訊管理系 中央大學土木系
第1,2课时 教学要求 教学内容 教学难点 教学重点 课后作业.
第三章 科学把握人生的方向和道路 教学目标 主要内容 第一节 追求高尚的人生目的 第二节 培养正确的人生态度 第三节 创造有价值的人生
第三章 资料的统计描述 上一张 下一张 主 页 退 出.
3.1 集中趋势的度量 3.2 离散程度的度量 3.3 偏态与峰态的度量
第一章.
第一章、統計的基本概念 國立高雄餐旅大學 沈瑞棋副教授.
統計學 授課教師:林志偉 Tel:5021.
Chapter 3 descriptive statistics:numerical methods
Descriptive statistics
第十四章 数值变量的统计描述.
分析化学教程 第二章 分析数据处理及 分析测试的质量保证 (1) 分析化学教程( 学年)
第二章 SAS的描述统计功能 2.1 描述性统计的基本概念 2.2 在SAS中计算统计量 2.3 统计图形.
第 3 章 敘述統計:數值方法.
第 5 章 樣本資料的數值分布.
Properties of Continuous probability distributions
Sampling Theory and Some Important Sampling Distributions
第一章 敘述統計學.
第 4 章 分散量數.
第四章 SPSS的基本统计分析.
Interval Estimation區間估計
本章重點: 一、集中量數的意義和種類 二、算術平均數 三、中位數(中數) 四、眾 數 五、其他集中量數 六、SPSS12.0實務操作
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
敍述統計學 許明宗.
第 3 章 敘述統計II:數值方法 Part A (3.1~3.2).
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
Workshop on Statistical Analysis
第一次上統計Tutorial 就上手 不是只有上一次嗎.
描述性统计学 作者 Dr. Maria Correa-Prisant 翻译 lvruiqin(DXY)
第四章 抽樣與抽樣分配 4.1 抽樣與抽樣方法 抽樣分配概論 常見的抽樣分配 中央極限定理55
Introduction to Basic Statistics
第七章 调查数据的分析 第一节 数据集中趋势的测定 第二节 数据离散程度的测定 第三节 动态数据的分析 第四节 相关与回归分析.
EXCEL+ORIGN+SPSS的描述统计
抽樣分配 Sampling Distributions
資料整理與次數分配 Organizing Data 社會統計(上).
相關統計觀念復習 Review II.
Introduction to Basic Statistics
Chapter 04 流程能力與績效分析.
Keller: Stats for Mgmt & Econ, 7th Ed 抽樣分配
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
Homework 1(1/2) 本頁表格為派密(Peavy)在07年球季各場次ERA的表現,(1)請依此數據完成下頁表格之統計值並說明之;(2)並與其他三名投手之統計值比較之。(請詳述計算過程) 場次 各場次ERA
第三章 平均数、标准差与变异系数 第一节 平均数 上一张 下一张 主 页 退 出.
Chapter 5 z-Scores.
Chapter 4 Variability 離散趨勢測量 2019/4/26.
计量资料的统计描述 赵耐青 复旦大学卫生统计教研室.
医学统计学 (Medical Statistics)
(四)标准差(standard deviation)
楊志強 博士 統計學 楊志強 博士
第四章 常用概率分布 韩国君 教授.
品質管理與實習 : MIL-STD-105E 何正斌 國立屏東科技大學工業管理學系.
第 6 章 统计量及其抽样分布 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
生物统计学 Biostatistics 第一章 统计数据的收集与整理
Probability Statistics p65 ~ 85 & p119~ /6/7
第七章 计量资料的统计分析.
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
Presentation transcript:

Dr. C. Hsieh College of Informatics Kao yuan University Mean & Variance Dr. C. Hsieh College of Informatics Kao yuan University

● 母體,群體(Population): 研究者所欲研究的全部對象所成之集合 樣本(Sample): 母體的部分集合 ● 參數,母數(Parameter): 描述母體的特徵量數 統計量(Statistic): 描述樣本的特徵量數

抽樣(Sampling) Population Sample Parameter Statistic Population size N Sample size n 推論(inference)

觀測值(Observations): X1 , X2 , …, Xn 有序統計量(Order Statistics): X(1) , X(2) ,…, X(n) ● 位置量數(Location measures), 集中趨勢量數(Measures of central tendency)   ● 差異量數(Dispersion measures)

用統計數字說話 描述資料中心(center)位置的統計數字: 描述資料分散(spread)程度的統計數字: 平均數(mean) 中位數(median) 描述資料分散(spread)程度的統計數字: 四分位(quartiles) 四分位間距(Interquartile range) 標準差(standard deviation)

平均數(mean) 所有資料加總除以資料個數即為平均數。 n 筆資料分別為x1, x2, …, xn則均數為 簡記為 以試算表演練實例

中位數(median) 將所有資料由小到大排序後,排在最中間 的數,稱為中位數,記為M。 n 筆資料的中位數 若 n 為奇數,則排序第(n +1)/2為中位數。 若 n 為偶數,則排序第 n /2與第 n/2 +1的平 均數為中位數。 以試算表演練實例

平均數與中位數的比較 對稱資料 偏斜資料(skewed data) 平均數與中位數的數字相當。 左偏斜資料(skewed to the left): 中位數在平均數的右邊,即中位數大於平均數。 右偏斜資料(skewed to the right): 中位數在平均數的左邊,即中位數小於平均數。 以試算表演練實例

右偏斜資料 (Figure 1.4)

Skewed (to the Right) Distribution 右偏斜分佈 Figure 1.15(b)

Symmetric Distribution 對稱分佈 Figure 1.15(a)

四分位數(quartiles) 將所有資料由小到大排序後, 四分位間距(inter-quartile range)

例題1.9 Mark McGwire 的全壘打數: (偶數) Babe Ruth 的全壘打數: (奇數) 9 9 22 32 33 39 39 42 49 52 58 70 Q1 M Q3 Babe Ruth 的全壘打數: (奇數) 22 25 34 35 41 41 46 46 46 47 49 54 54 59 60 Q1 M Q3

五數總結與盒形圖 五個重要敘述性統計量,最小值、第1 四分位數、 中位數、第3 四分位數及最大值又稱為五數總結 (five-number summary)。 軟體多可算出五數總結的資料。 盒形圖(boxplot)將資料的五數總結,以圖形呈現 出來。

● 位置量數: 1.平均數(Mean) (統計量) (參數) 2.中位數(Median) 3.眾數(Mode)

第 k 百分位數(k-th Percentile) where Note: 10. Sample size n=50

20. P50=Md 30. 四分位數(Quartile) Q1= P25 , Q2= P50=Md , Q3= P75 40. 十分位數(Deciles) D1= P10 , D2= P20 , … , D9= P90

● 差異量數 1.全距(Range) R=X(n) - X(1) 2.四分位距(Interquartile-range) IQR=Q3 - Q1 3.四分位差(Quartile deviation) Q.D.=IQR/2(=Q2 - Q1=Q3 - Q2 ,對稱資料)

4.平均絕對偏差(Mean Absolute Deviation) 5.變異數(Variance) , 6.標準差(Standard Deviation) (統計量) (參數)

7.變異係數(Coefficient of Variation) (統計量) (參數) 例1. 成人 v.s. 小孩之體重   樣本數 平均數 標準差 C.V. 成人 160 57.0 11.0 19.3% 小孩 18 5.6 1.4 25.0%

例2. 某一群小孩之身高、體重 如下表   平均數 標準差 C.V. 身高 120 15 12.5% 體重 25 5 20.0%

標準差(Standard Deviation)與 變異數(Variance) n 筆資料分別為 x1, x2, …, xn,則定義變異數為 簡記為 標準差 s 則為變異數 s2 的平方根

標準差與變異數實例 例題1.10:7位受試者的新陳代謝率,每24小時消耗卡路里數,資料如下: 1792, 1666, 1362, 1614, 1460, 1867, 1439 平均數為 1600卡路里。 變異數為 s2 = 35,811.67 。 標準差為 s = 189.24 卡路里。

標準差與變異數演算

離差(deviation)圖示 x = 1439 x = 1792 離差= -161 離差= 192 1300 1400 1500 1600 離差= 192 1300 1400 1500 1600 1700 1800 1900

離差值與自由度 n 筆資料對均值的差稱為離差值,即 因為 n 個離差值的總和必為零, 所以第n 個離差值,可由前面 n - 1個離差值來決定。我們稱離差值有n - 1個自由度 (degrees of freedom)。

標準差的運用 平均數 被選為度量中心時,標準差s可度量平均值的離散度。 所有的資料都一樣時,s = 0,沒有離散度。其他情形 s 都大於零。