第一章 敘述統計學.

Slides:



Advertisements
Similar presentations
2007 年广州市初中信息技术 结业考试海珠区质量分析 海珠区教育发展中心 范谊 2007 年 9 月 8 日.
Advertisements

心理与教育测量学 贵州师范大学教育科学学院 赵守盈.
第二章 语言测试的功能与分类 湖南师范大学外国语学院 邓 杰 教授.
資料分析 ---敘述統計分析.
資料概說 1.1 基本名詞介紹 1.2 資料型態 1.3 基本操作 商管研究資料分析SPSS的應用 Chapter 1 資料概說.
1 Chapter 統計學緒論.
Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心
人群健康研究的统计方法 预防医学系 指导教师:方亚 电话:
Measures of location and dispersion
第一章 生物统计学基本知识 1、明确统计在做什么事情、将用什么样的方式去做。 2、生物统计与统计学的关系,其涉及哪些内容 1.
Keller: Stats for Mgmt & Econ, 7th Ed 圖表敘述法
生物醫學統計學.
SPSS统计软件的使用方法基础 主讲人:宋振世 (闵行校区) 电 话:
第 1 章 資料與統計.
統計學 郭信霖 許淑卿.
如何使用 Excel 與SPSS繪製 統計圖型
医学统计学 主讲人:信息部 林雪君.
3.1 集中趋势的度量 3.2 离散程度的度量 3.3 偏态与峰态的度量
第一章.
統計學 授課教師:林志偉 Tel:5021.
Chapter 3 descriptive statistics:numerical methods
Descriptive statistics
試算表軟體 II 醫務管理暨醫療資訊學系 陳以德 副教授: 濟世CS 轉
SPC introduction.
第十四章 数值变量的统计描述.
第二章 SAS的描述统计功能 2.1 描述性统计的基本概念 2.2 在SAS中计算统计量 2.3 统计图形.
第 3 章 敘述統計:數值方法.
描述資料: 次數表, 次數分配, 以及 統計圖 第二章
第 5 章 樣本資料的數值分布.
3.2 Tally Table:將資料分成等距離的組別,再
Chapter 2 第二章 Presenting Data in Tables and Charts 統計圖及表的應用
Sampling Theory and Some Important Sampling Distributions
敘述統計-資料的特性 Properties of Variable
Chapter 2 頻率分配.
STATA 7 蘇國賢.
第 3 章 敘述統計II:數值方法 Part B (3.3~3.6).
統計基本觀念 壹、資料 資料來源:實驗之量測結果,抽樣調查結果,公告資料。 一、資料類型
圖表製作 集中指標 0628 統計學.
第 4 章 分散量數.
第四章 SPSS的基本统计分析.
第 2 章 敘述統計:表格與圖形法.
本章重點: 一、集中量數的意義和種類 二、算術平均數 三、中位數(中數) 四、眾 數 五、其他集中量數 六、SPSS12.0實務操作
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
敍述統計學 許明宗.
第 3 章 敘述統計II:數值方法 Part A (3.1~3.2).
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
Workshop on Statistical Analysis
第一次上統計Tutorial 就上手 不是只有上一次嗎.
表達及陳列統計資料 統計圖表 統計量數 次數分配表 直方圖 次數多邊圖 累加次數圖 條形圖 圓形比例圖 集中量數 變異量數或離散量數
敘述統計I:表格與圖形法 Part A ( ) 第 2 章 敘述統計I:表格與圖形法 Part A ( )
描述性统计学 作者 Dr. Maria Correa-Prisant 翻译 lvruiqin(DXY)
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
Introduction to Basic Statistics
EXCEL+ORIGN+SPSS的描述统计
資料整理與次數分配 Organizing Data 社會統計(上).
準確性(Accuracy) 誤差種類 儀器準確度 時間因素 儀器參數.
Homework 1(1/2) 本頁表格為派密(Peavy)在07年球季各場次ERA的表現,(1)請依此數據完成下頁表格之統計值並說明之;(2)並與其他三名投手之統計值比較之。(請詳述計算過程) 場次 各場次ERA
Dr. C. Hsieh College of Informatics Kao yuan University
Chapter 5 z-Scores.
統計學簡介 許明宗.
资料的描述性分析 庄文忠 副教授 世新大学行政管理学系 SPSS之应用(庄文忠副教授) 2012/7/6.
Review of Statistics.
楊志強 博士 統計學 楊志強 博士
第二章 次數分配表與統計圖 第一節 次數分配表的製作 第二節 統計圖的製作 第三節 次數分配的形狀和性質 第四節 電腦習作.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
生物统计学 Biostatistics 第一章 统计数据的收集与整理
第七章 计量资料的统计分析.
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
地理資料 包含兩部分 地理位置 表明這個地理資料的位置在何處。地理資料為空間資料的一種,因此必須對空間中的位置加以標定 屬性
Presentation transcript:

第一章 敘述統計學

學習重點 分辨屬性與屬量數據 描述名目、順序、區間跟比例尺度的測量值 描述母體與樣本的差異 計算並解讀百分位數與四分位數 知道如何計算集中傾向的測度並且解釋之 產生各式各樣描述數據集的圖表 利用 Excel 樣板計算各式各樣的測度及產生各種圖表

四種測量尺度 名目尺度 (nominal scale) 只是一個名字 順序尺度 (ordinal scale) 是數據可以依照某種條件由小排到大 區間尺度 (interval scale) 是數據間的距離有意義 比例尺度 (ratio scale) 則是數據間的距離與比例皆有意義

母體與樣本 母體 (population):包含研究者有興趣的所有測量值,亦稱為宇集 (universe)。 樣本 (sample):選自母體的部分集合。

百分位數與四分位數 百分位數 (percentile):比指定的百分比的數據點大的數字 四分位數 (quartile) :25 的倍數的百分位數

百分位數與四分位數 第一個四分位數,也稱為下四分位數 (lower quartile) ,就是第 25 個百分位數。 第二個四分位數是第 50 個百分位數,也叫中四分位數 (middle quartile) 或中位數 (median)。 第三個四分位數是第 75 個百分位數,也叫上四分位數 (upper quartile)。

1-3 Measures of Central Tendency(集中趨勢)or Location  Median(中位數) Middle value when sorted in order of magnitude 50th percentile  Mode(中數) Most frequently- occurring value  Mean(平均數) Average

例1-2 找出世界前20位富翁的第50個跟第80個百分位數 Templates (ch 1: Basic Statistics)

Example – Median (Data is used from Example 1-2) Sales Sorted Sales 9 6 6 9 12 10 10 12 13 13 15 14 16 14 14 15 14 16 16 16 17 16 16 17 24 17 21 18 22 18 18 19 19 20 18 21 20 22 17 24 See slide # 19 for the template output Median 50th Percentile (20+1)50/100=10.5 16 + (.5)(0) = 16 Median The median is the middle value of data sorted in order of magnitude. It is the 50th percentile.

Example - Mode (Data is used from Example 1-2) See slide # 19 for the template output . . . . . . : . : : : . . . . . --------------------------------------------------------------- 6 9 10 12 13 14 15 16 17 18 19 20 21 22 24 Mode = 16 The mode is the most frequently occurring value. It is the value with the highest frequency.

Arithmetic Mean or Average(算術平均) The mean of a set of observations is their average - the sum of the observed values divided by the number of observations. Population Mean Sample Mean m = å x N i 1 x n i = å 1

變化的測度 全距 (range):是最大觀察值減最小觀察值。變異數 (variance) :全部數據點「與平均偏離平方和 」的平均。標準差 (standard deviation):是變異數的方根。

Variance(變異數) and Standard Deviation(標準差) Population Variance Sample Variance n N å ( x - x ) 2 å ( x - m ) 2 s = 2 i = 1 s = ( ) 2 i = 1 n - 1 N ( ) ( ) 2 N n 2 x x å å N å = n = - i 1 å x - i 1 x 2 2 N n = = i = 1 i = 1 ( ) N n - 1 s = s 2 s = s 2

例1-2 找出世界前20位富翁財富的平均數、變異數、標準差

偏度與峰度 偏度 (skewness) 是頻率分配不對稱程度的測度。 偏度為0表示對稱, 偏度為正表示右偏,偏度為負表示左偏。 峰度 (kurtosis) 是頻率分配扁平程度的測度。 峰度越大表示分配越瘦越尖。常態分配的峰度為3 相對扁度 = 絕對扁度 - 3

Summary Measures: Population Parameters Sample Statistics Measures of Central Tendency Median (中位數) Mode (眾數) Mean (平均數) Measures of Variability Range (全距) Interquartile range Variance (變異數) Standard Deviation (標準差) Other summary measures: Skewness (偏態) Kurtosis (峰態)

柴比雪夫定理 柴比雪夫定理 (Chebyshev’s theorem) 的原則如下: 1. 至少有四分之三的經驗值,與平均的偏 離落入兩個標準差內 2. 至少九分之八的觀察值,與平均的偏離 落入三個標準差內

經驗法則 如果數據分配是山形的 (mound-shaped),則此數據集可適用嚴格一點的原則,就是所謂的經驗法則: 1. 大約有 68% 的觀察值,與平均的偏離落 入 1 個標準差內 2. 大約有 95% 的觀察值,與平均的偏離落 入 2 個標準差內 3. 絕大部分 (幾乎全部) 的觀察值,與平均 的偏離落入 3 個標準差內

呈現數據的方法 圓餅圖 (pie chart):簡單描述呈現某種離散型數(分類數據)。 直條圖 (bar chart):用來呈現分類數據,它的測量尺度可以是名目的或是順序的。 頻率多邊形 (frequency polygon):類似直方圖,只有各區間的中點落在與該區間的頻率或相對頻率成比例的高度上。 肩形圖 (ogive):是一種累加頻率圖。

Pie Chart(餅圖)

Bar Chart(直條圖) Fig. 1-11 Airline Operating Expenses and Revenues 2 Average Revenues Average Expenses 1 8 6 4 2 American Continental Delta Northwest Southwest United USAir A i r l i n e

Frequency Polygon(頻率多邊形) and Ogive(累加頻率圖) Relative Frequency Polygon Ogive 5 4 3 2 1 . Relative Frequency Sales 5 4 3 2 1 . Cumulative Relative Frequency Sales

數據探查分析 莖葉圖 (stem-and-leaf display):一種快速審視數據的技巧,包含某些直方圖的特徵。 盒形圖:也叫盒鬚圖,是另一種端詳數據的方法。

Box Plot(盒形圖) Elements of a Box Plot * o Q1 Q3 Inner Fence Outer Median Q1 Q3 Inner Fence Outer Interquartile Range Smallest data point not below inner fence Largest data point not exceeding inner fence Suspected outlier Outlier Q1-3(IQR) Q1-1.5(IQR) Q3+1.5(IQR) Q3+3(IQR)

Example: Box Plot(盒形圖)

K線圖

例1-8 42位工程師回答他們在銀幕上所看到的狀況,而完成某項工作的時間。 分六組,並繪出折線圖、直條圖、餅圖。

作業 任選並下載一支台灣上市公司過去250天股價資料,使用EXCEL將這些資料計算日報酬率及: 敘述統計 頻率、相對頻率、累加頻率 日報酬頻率分佈圖、累加分佈圖 平均數、變異數、標準差 四分位數、百分位數、偏態係數、峰態係數