EXCEL+ORIGN+SPSS的描述统计

Slides:



Advertisements
Similar presentations
考试 1. 时间 :2011 年 11 月 14 日 18:30 2. 地点 : 待定 3. 方式 : 开卷考试 4. 题目类型:待定 5. 计算机操作要求:会用 spss 录数据、计算机 操作、认读结果、制作统计表、按假设检 验步骤进行假设检验.
Advertisements

2007 年广州市初中信息技术 结业考试海珠区质量分析 海珠区教育发展中心 范谊 2007 年 9 月 8 日.
数 理 统 计 华南农业大学理学院应用数学系 Statistics Applied Mathematic Department, College of Sciences, SCAU.
中国旅游研究院武汉分院成果展示 ——2011年武汉市旅游市场调研成果简报 华中师范大学 中国旅游研究院武汉分院 二〇一一年十二月.
SPSS 軟體與統計應用 Ya-Yun Cheng, How-Ran Guo
第二章 语言测试的功能与分类 湖南师范大学外国语学院 邓 杰 教授.
資料分析 ---敘述統計分析.
資料概說 1.1 基本名詞介紹 1.2 資料型態 1.3 基本操作 商管研究資料分析SPSS的應用 Chapter 1 資料概說.
Dr. Baokun Li 经济实验教学中心 商务数据挖掘中心
Measures of location and dispersion
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习1 主讲人 陶育纯 医学统计学方法 实习1 主讲人 陶育纯 流行病与卫生统计学教研室
SPSS统计软件的使用方法基础 主讲人:宋振世 (闵行校区) 电 话:
医学统计学 8 主讲人 陶育纯 医学统计学 8 主讲人 陶育纯
DOE & EXCEL, SPSS application
如何使用 Excel 與SPSS繪製 統計圖型
统计学Statistics 主讲人:商学院 刘后平 教授
第三章 资料的统计描述 上一张 下一张 主 页 退 出.
3.1 集中趋势的度量 3.2 离散程度的度量 3.3 偏态与峰态的度量
第一章.
Descriptive statistics
試算表軟體 II 醫務管理暨醫療資訊學系 陳以德 副教授: 濟世CS 轉
SPC introduction.
第四章 單變量描述性分析 第一節 描述性統計原理 第二節 報告(Reports)
SAS  統計程序實作 CONTENTS By DR. Yang , Yi-Chiang /11/11.
第十四章 数值变量的统计描述.
第二章 SAS的描述统计功能 2.1 描述性统计的基本概念 2.2 在SAS中计算统计量 2.3 统计图形.
第 3 章 敘述統計:數值方法.
第七章 SPSS的非参数检验.
第 5 章 樣本資料的數值分布.
Chapter 2 第二章 Presenting Data in Tables and Charts 統計圖及表的應用
Sampling Theory and Some Important Sampling Distributions
量化研究與統計分析 比較平均數 Test 謝寶煖 台灣大學圖書資訊學系 2006年4月1日.
第 八 章 迴歸分析假設條件 之檢定及補救措施 2018/11/28.
R教學 單元5 敘述統計 羅琪老師.
STATA 7 蘇國賢.
Origin绘图和数据分析 2006年11月.
第一章 敘述統計學.
統計基本觀念 壹、資料 資料來源:實驗之量測結果,抽樣調查結果,公告資料。 一、資料類型
圖表製作 集中指標 0628 統計學.
Tel: 第11章 SPSS在时间序列预测中的应用 周早弘 旅游与城市管理学院
第 4 章 分散量數.
第四章 SPSS的基本统计分析.
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
敍述統計學 許明宗.
第 3 章 敘述統計II:數值方法 Part A (3.1~3.2).
Review 統 計 方 法 的 順 序 確定目的 蒐集資料 整理資料 分析資料 推論資料 (變量,對象) (方法:普查,抽樣)
医学统计学 3 主讲人 陶育纯 医学统计学 3 主讲人 陶育纯
第一次上統計Tutorial 就上手 不是只有上一次嗎.
敘述統計I:表格與圖形法 Part A ( ) 第 2 章 敘述統計I:表格與圖形法 Part A ( )
描述性统计学 作者 Dr. Maria Correa-Prisant 翻译 lvruiqin(DXY)
第九章 離散程度.
MyLibrary ——数字图书馆的个性化服务
第3章 預測 2019/4/11 第3章 預測.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
資料整理與次數分配 Organizing Data 社會統計(上).
Homework 1(1/2) 本頁表格為派密(Peavy)在07年球季各場次ERA的表現,(1)請依此數據完成下頁表格之統計值並說明之;(2)並與其他三名投手之統計值比較之。(請詳述計算過程) 場次 各場次ERA
國二EXCEL專案 上機考試版本: 主講者:黃韋欽 老師 考試者:國二全體學生.
Dr. C. Hsieh College of Informatics Kao yuan University
新媒体环保公益广告现状调查及发展潜力研究
統計學回顧 區國強.
Review of Statistics.
楊志強 博士 統計學 楊志強 博士
第7章 基本统计分析 2019/5/14.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
统计软件应用 4 主讲人 陶育纯 SPSS统计分析 统计软件应用 4 主讲人 陶育纯 教案.
生物统计学 Biostatistics 第一章 统计数据的收集与整理
统计工具的使用方法 主讲人 陶育纯 统计工具的使用方法 主讲人 陶育纯
第七章 计量资料的统计分析.
主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士
SAS 統計程序實作 PROC MEANS (一個母體)
Presentation transcript:

EXCEL+ORIGN+SPSS的描述统计

100个果丹皮的长度 单位:cm 10.60 10.62 10.64 10.46 10.21 10.50 10.45 10.39 10.36 10.49 10.57 10.44 10.25 10.53 10.48 10.24 10.41 10.30 10.23 10.34 10.40 10.42 10.29 10.28 10.54 10.31 10.32 10.51 10.37 10.35 10.33 10.55 10.58 10.43

一、用ORIGIN进行描述统计(先了解ORIGIN,请参阅ORIGIN介绍文件夹)

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计 (1)Input Data项:右边下拉框可选择是对当前列统计,还是合并整个数据集统计; (2)Quantities to Compute项:打开Moments和Quantiles选中其中的复选框可以选择要计算和显示的统计项,Extreme Values复选框:是否计算显示极大/极小值; (3)Output Results项:输出图形或报表选项; (4)Plots:作图,Histograms复选框:是否计算输出柱状统计图;Box Charts复选框:是否计算输出方框统计图。

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计 在通过Quantities to Compute中的设置,Descriptive Statistics项可以显示如下统计项(本章Excel文档有更详细的解释): (1)N Total:数据点数目; (2)N Missing:缺失的数据点数目; (3)Mean:平均值; (4)Standard Deviation:标准偏差; (5)SE of Mean:平均值的标准误差;

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计 (6)Lower 95% CI of Mean:平均值的95%置信区间的下限; (7)Upper 95% CI of Mean:平均值的95%置信区间的上限; (8)Variance:标准偏差的平方(方差); (9)Sum:总和; (10)Skeweness:倾斜度数; (11)Kutosis:峰度;

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计 (12)Uncorrected Sum of Squares:未改正的平方和; (13)Coefficient of Variance:变异系数; (14)Mean absolute Deviation:绝对偏差; (15)SD times 2:标准偏差乘以2; (16)SD times 3:标准偏差乘以3; (17)Geometric Mean:几何平均数; (18)Geometric SD:几何标准偏差;

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计 (19)Mode:出现频率最高的数据(众数); (20)Sum of Weight:权重总和; (21)Minimum:最小值; (22)Index of Minimum:最小值的索引; (23)1st Quartile(Q1):插值操作时的Q1值(25%); (24)Median:插值操作时的Q2值(50%); (25)3rd Quartile(Q3):插值操作时的Q3值(75%);

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计 (26)Maximum:最大值; (27)Index of Maximum:最大值的索引; (28)Interquartile Range(Q3-Q1):插值范围; (29)Rang(Maximum-Minimum) :极差; (30)Custom Percentile(s):定制百分位数; (31)Percentile list:是否列出百分位数。

一、用ORIGIN进行描述统计 2. Frequency Counts频率统计 频率/频度统计即将数据分成一系列区间,然后分别计算符合区间的数值。使用Statistics→Frequency Count打开对话框。 主要参数包括如下内容。(1)Input:数据源;(2)From Minimum:区间最小值;(3)To Maximum:区间最大值;(4)Step by:产生区间段(bins)的方法;包括Increment(增加步长)和Intervals(间隔);(5)Include Outliers<Minimum:异常值(Outliers)小于最小值时加入到最小区间段;

一、用ORIGIN进行描述统计 2. Frequency Counts频率统计 主要参数包括如下内容。(6)Include Outliers>=Maximum:异常值大于最大值时加入到最大区间段;(7)Bin Center:区间段中值;(8)Bin End:区间段结束值;(9)Count:每个区间段计数;(10)CulmuIative Count:积累计数,即将前面的再累加;(11)Relative Frequency:相对频度;(12)Cumulative Frequency:积累频度;(13)Output:输出目标工作表。

Statistics→Frequency Count

Statistics→Frequency Count

Statistics→Frequency Count

一、用ORIGIN进行描述统计 3. Discrete Frequency离散频率统计 离散频率统计,可以对各个数据段中数据出现的频率进行统计。执行Statistics→Discrete Frequency命令之后,可以打开Statistics\Descriptive Statistics:discfreqs对话框,其中包括:(1)Frequency复选框:是否统计频率;(2)Percent复选框:是否统计每个频率的百分比;(3)Cumulative Percent复选框:是否统计频率统计的累积百分比;(4)Case Sensitive复选框:是否区分大小写。

一、用ORIGIN进行描述统计 3. Discrete Frequency离散频率统计

一、用ORIGIN进行描述统计 3. Discrete Frequency离散频率统计

一、用ORIGIN进行描述统计 3.Discrete Frequency离散频率统计

一、用ORIGIN进行描述统计 4. Normality Test正态检验 正态检验可以测试所统计的数据分布是否符合正态分布。执行Statistics→Normality Test命令之后,可以打开Normality Test对话框,其中包括如下几项。(1)Quantities to Compute:正态检验的方法选择,包括Shapiro-Wilk:是否进行Shapiro-Wilk统计;Kolmogorov-Smirnov:是否进行Kolmogorov-Smirnov统计,选中之后可以从Parameters下拉框中选择参数来源Estimated(从输入数据中获得)、Specified(用户指定)、Mean(平均值)

一、用ORIGIN进行描述统计 4. Normality Test正态检验 正态检验可以测试所统计的数据分布是否符合正态分布。执行Statistics→Normality Test命令之后,可以打开Normality Test对话框,其中包括如下几项。 和Variance(异常值);Lilliefors:是否进行Lilliefors统计;(2)Output Results:输出选项;(3)Plot:作图选项。

一、用ORIGIN进行描述统计 4. Normality Test正态检验 正态检验可以测试所统计的数据分布是否符合正态分布。执行Statistics→Normality Test命令之后,可以打开Normality Test对话框,其中包括如下几项。 和Variance(异常值);Lilliefors:是否进行Lilliefors统计;(2)Output Results:输出选项;(3)Plot:作图选项。

一、用ORIGIN进行描述统计 4. Normality Test正态检验 SPSS对一组数据进行正态性检验有2种方法,Kolmogorov-Smirnov Test和Shapiro-Wilk Test。Kolmogorov-Smirnov Test检验结果较精确,适用于小样本的检测,而 Shapiro-Wilk Test适用于大样本的检验,本题n=100(<200),因此属于小样本,因此对因变量y进行正态性检验后利用Kolmogorov-Smirnov Test 的输出结果。

一、用ORIGIN进行描述统计 4. Normality Test正态检验

一、用ORIGIN进行描述统计 4. Normality Test正态检验

一、用ORIGIN进行描述统计 4. Normality Test正态检验 Kolmogorov-Smirnov Test 统计量0.06108,显著水平Sig.=0.91146>0.05,所以因变量y服从正态分布,即y是正态变量可以进行描述统计分析。

一、用ORIGIN进行描述统计 5.常用的统计图形包括直方图、方框图和质量控制图等。 (1)Histogram直方图 选中Worksheet的2个Y列,通过Plot→Statistics→Histogram命令,即可生成直方统计图。这个图形可以清楚地比较不同区间里,数据的出现次数。右键单击图形,选择Go to Bin Worksheet命令,可以弹出一个统计表。另外,选择Properties…命令可以修改图形的外观。

一、用ORIGIN进行描述统计 (1)Histogram直方图

一、用ORIGIN进行描述统计 (2) Histogram+Probabilities概率直方图 选中Worksheet的B列,通过Plot→Statistics Graphs→Histogram+Probabilities命令,即可生成概率直方图。其中上面的图为数据的累积出现个数,下面的则为各个区间里数据出现的次数。另外,右键单击图形,选择Go to Bin Worksheet命令,可以弹出一个与直方图一样的统计表。

一、用ORIGIN进行描述统计 (2)Histogram+Probabilities概率直方图

二、用SPSS进行描述统计(先了解SPSS)

二、用SPSS进行描述统计

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率 均数:Mean;均数的标准误差:Std. Error of Mean;中位数:Median;众数:Mode;标准差:Std. Deviation;方差:Variance;偏度系数:Skewness;偏度系数的标准误差:Std. Error of Skewness;峰度系数:Kurtosis;峰度系数的标准误差:Std. Error of Kurtosis;极差:全距,Range;最小值:Minimum;最大值:Maximum;总和:Sum;百分位数:percentiles。

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 2.描述

二、用SPSS进行描述统计 2.描述

二、用SPSS进行描述统计 2.描述

二、用SPSS进行描述统计 2.描述

二、用SPSS进行描述统计 2.描述

三、用EXCEL进行描述统计

三、用EXCEL进行描述统计

描述统计量大致可以分为三类: 集中趋势 离中趋势 分布趋势

反映集中趋势的描述统计量 常用的反映集中趋势的描述统计量有五个:算术平均数、调和平均数、几何平均数、中位数和众数。前三个平均数是根据所有标志值计算的,又被称为数值平均数,后两个平均数是根据与其所处位置有关的部分标志值计算的,又被称为位置平均数。

AVERAGE(NUMBER1,NUMBER2,……) 算术平均数 算术平均数是数据集中趋势的最主要的统计描述量。计算算术平均数使用AVERAGE函数,格式为: AVERAGE(NUMBER1,NUMBER2,……) NUMBER可以是具体的数值,也可以是单元地址或区域名称。

调和平均数 调和平均数 (又称倒数平均数)是数值倒数算术平均值的倒数。在实际工作中,由于所获数据不能直接代入算术平均数的公式中计算,就需要有倒数平均数的形式。计算调和平均数使用HARMEAN函数,格式为: HARMEAN(NUMBER1,NUMBER2,……)

几何平均数 几何平均数 是N个数值的连乘积,再开N次方根,它是计算平均比率和平均发展速度最适宜的一种方法,因为其数学性质与现象发展的平均速度形成的客观过程相一致。计算几何平均数使用GEOMEAN函数,格式为: GEOMEAN(NUMBER1,NUMBER2,……)

MEDIAN(NUMBER1,NUMBER2,……) 中位数 中位数是将全部数值按大小顺序排列后居于中间位置的数值。换句话说,中位数把所有的数值一分为二,有一半数值比它小,另一半数值比它大。 计算中位数使用MEDIAN函数,格式为: MEDIAN(NUMBER1,NUMBER2,……)

MODE(NUMBER1,NUMBER2,……) 众数 众数是在数列或数据区域中出现频率最多的数值。 计算众数使用MODE函数,格式为: MODE(NUMBER1,NUMBER2,……)

反映离中趋势的描述统计量 常用的反映离中趋势的描述统计量(简称离中指标)有三个:全距、平均差和标准差(方差)。当对两组数据的差异程度进行相对比较时,往往要计算离散系数,包括全距系数、平均差系数和标准差系数,它等于相应的离中指标除以算术平均数,这样可以消除由于平均数的不同或单位的差异而造成的影响。

全距 全距(又称极差)是最大值与最小值之差,用“MAX(ARRAY)—MIN(ARRAY)”求得。ARRAY是指原始资料的存放区域,并且前后应该一致。全距最显著的特点是计算简便、含义清晰,实际工作中常用于产品质量的检验和控制,但全距容易受极端值的影响。

平均差 平均差是各个数据与其算术平均数离差绝对值的算术平均数。 计算平均差使用AVEDEV函数, 格式为:AVEDEV(NUMBER1,NUMBER2,……) NUMBER可以是具体的数值,也可以是单元地址或区域名称。 例:AVEDEV(4, 5, 6, 7, 5, 4, 3) = 1.020408

标准差 标准差用于反映相对于算术平均数的离散程度。计算标准差的函数有两个,一是STDEV函数,二是STDEVP函数。两者的参数是完全一致的,只是计算的公式略有一点不同。 格式为: STDEV (NUMBER1,NUMBER2,……) STDEVP(NUMBER1,NUMBER2,……)

方差 方差是标准差的平方,它也是衡量离散程度的重要指标。计算方差有两个函数,前者是计算样本方差的,后者是计算总体方差的。格式为: VAR (NUMBER1,NUMBER2,……) VARP(NUMBER1,NUMBER2,……)。

反映分布趋势的描述统计量 常用的反映分布趋势的描述统计量有两个: 偏斜度 峰值

偏斜度 偏斜度反映以平均值为中心的分布的不对称程度 。 计算偏斜度使用SKEW函数,格式为:SKEW(NUMBER1,NUMBER2,……)

峰度 峰度反映与正态分布相比某一分布的尖锐度或平坦度。 计算峰度使用KURT函数,格式为:KURT(NUMBER1,NUMBER2,……)

三、用EXCEL进行描述统计 平均 10.3952 标准误差 0.010117971 中位数 10.395 众数 10.4 标准差 0.101179708 方差 0.010237333 峰度 -0.525357096 偏度 0.123065672 区域 0.43 最小值 10.21 最大值 10.64 求和 1039.52 观测数 100 最大(1) 最小(1) 置信度(95.0%) 0.020076249

编制次数分布表的步骤 (1)整列:将所取得的原始数据给予顺序排列,数值小的在前面,数值大的在后面。 (2)求极差: (3)分组:100个变量可分7~9组或9~12组。可用公式(K=1+(lgn/lg2))来确定组数。 (4)确定组距:组距是指上一组与下一组的数值之间的差值,通常用i表示。组距一般用整数。如本例中取9组,全距为0.43cm,则组距为:i=R/组数=0.43/9=0.048≈0.05(cm)

编制次数分布表的步骤 (5)确定组限与组中值:组限就是各组的变异范围,即各组的上、下限。组中最小的数值称下限;最大的数值称上限。第一组的下限不应由资料中最小的数值开始,而最小的数值则包含在第一组内。同理,最后一组的上限就避免以最大的数值结束,其最大的数值则应包括在最后一组内。

编制次数分布表的步骤 (5) 另外,组限的小数点位数应比数据的小数点位数多一位,这样才能避免数据重复划。上限与下限的平均数称为组中值。用以代表该组所有变数的平均数。组中值应尽量采用整数,以便于计算。组中值加、减二分之一组距,便分别得到该组的上、下限。首先确定第一组的组中值,确定之后,其它各组的组中值及组限便可以依照组距为等级差数依次推出。

编制次数分布表的步骤 (6)计算各组变量所出现的次数:将各组上、下限内所包括的变数分别归入各组,计算各组变量所出现的次数。一般先用记号“正数”计数,然后按记号统计次数,制成次数分布表如下表所示。

100个果丹皮的长度次数分布表 组限 组中值 记号 次数(f) 相对次数/% 累计次数/% 10.195~10.244 10.22 正+3 8 10.245~10.294 10.27 正正+1 11 19 10.295~10.344 10.32 正正+3 13 32 10.345~10.394 10.37 正正正+3 18 50 10.395~10.444 10.42 68 10.445~10.494 10.47 正正正 15 83 10.495~10.544 10.52 正正 10 93 10.545~10.594 10.57 +4 4 97 10.595~10.644 10.62 +3 3 100

编制次数分布表的步骤 从次数分布表中可以看出,果丹皮长度在10.195~10.444cm。为方便起见,可制成次数分布图。次数分布图有方柱形图和多边形图。