EXCEL+ORIGN+SPSS的描述统计

Slides:

Advertisements

Similar presentations

考试 1. 时间 :2011 年 11 月 14 日 18:30 2. 地点 : 待定 3. 方式 : 开卷考试 4. 题目类型：待定 5. 计算机操作要求：会用 spss 录数据、计算机操作、认读结果、制作统计表、按假设检验步骤进行假设检验.

Advertisements

2007 年广州市初中信息技术结业考试海珠区质量分析海珠区教育发展中心范谊 2007 年 9 月 8 日.

数理统计华南农业大学理学院应用数学系 Statistics Applied Mathematic Department, College of Sciences, SCAU.

中国旅游研究院武汉分院成果展示 ——2011年武汉市旅游市场调研成果简报华中师范大学中国旅游研究院武汉分院二〇一一年十二月.

SPSS 軟體與統計應用 Ya-Yun Cheng, How-Ran Guo

第二章语言测试的功能与分类湖南师范大学外国语学院邓杰教授.

資料分析 ---敘述統計分析.

資料概說 1.1 基本名詞介紹 1.2 資料型態 1.3 基本操作商管研究資料分析SPSS的應用 Chapter 1 資料概說.

Dr. Baokun Li 经济实验教学中心商务数据挖掘中心

Measures of location and dispersion

第三篇医学统计学方法. 第三篇医学统计学方法医学统计学方法实习1 主讲人陶育纯医学统计学方法实习1 主讲人陶育纯流行病与卫生统计学教研室

SPSS统计软件的使用方法基础主讲人：宋振世（闵行校区）电话：

医学统计学 8 主讲人陶育纯医学统计学 8 主讲人陶育纯

DOE & EXCEL, SPSS application

如何使用 Excel 與SPSS繪製統計圖型

统计学Statistics 主讲人：商学院刘后平教授

第三章资料的统计描述上一张下一张主页退出.

3.1 集中趋势的度量 3.2 离散程度的度量 3.3 偏态与峰态的度量

Descriptive statistics

試算表軟體 II 醫務管理暨醫療資訊學系陳以德副教授: 濟世CS 轉

SPC introduction.

第四章單變量描述性分析第一節描述性統計原理第二節報告（Reports）

SAS 統計程序實作 CONTENTS By DR. Yang , Yi-Chiang /11/11.

第十四章数值变量的统计描述.

第二章 SAS的描述统计功能 2.1 描述性统计的基本概念 2.2 在SAS中计算统计量 2.3 统计图形.

第 3 章敘述統計：數值方法.

第七章 SPSS的非参数检验.

第 5 章樣本資料的數值分布.

Chapter 2 第二章 Presenting Data in Tables and Charts 統計圖及表的應用

Sampling Theory and Some Important Sampling Distributions

量化研究與統計分析比較平均數 Test 謝寶煖台灣大學圖書資訊學系 2006年4月1日.

第八章迴歸分析假設條件之檢定及補救措施 2018/11/28.

R教學單元5 敘述統計羅琪老師.

STATA 7 蘇國賢.

Origin绘图和数据分析 2006年11月.

第一章敘述統計學.

統計基本觀念壹、資料資料來源：實驗之量測結果，抽樣調查結果，公告資料。一、資料類型

圖表製作集中指標 0628 統計學.

Tel: 第11章 SPSS在时间序列预测中的应用周早弘旅游与城市管理学院

第 4 章分散量數.

第四章 SPSS的基本统计分析.

統計量數集中趨勢量數離散趨勢量數相對位置量數分配形態量數.

敍述統計學許明宗.

第 3 章敘述統計II：數值方法 Part A (3.1~3.2).

Review 統計方法的順序確定目的蒐集資料整理資料分析資料推論資料 (變量，對象) (方法：普查，抽樣)

医学统计学 3 主讲人陶育纯医学统计学 3 主讲人陶育纯

第一次上統計Tutorial 就上手不是只有上一次嗎.

敘述統計I：表格與圖形法 Part A ( ) 第 2 章敘述統計I：表格與圖形法 Part A ( )

描述性统计学作者 Dr. Maria Correa-Prisant 翻译 lvruiqin(DXY)

第九章離散程度.

MyLibrary ——数字图书馆的个性化服务

第3章預測 2019/4/11 第3章預測.

统计学 (第三版) 2008 作者贾俊平统计学.

資料整理與次數分配 Organizing Data 社會統計（上）.

Homework 1(1/2) 本頁表格為派密(Peavy)在07年球季各場次ERA的表現，(1)請依此數據完成下頁表格之統計值並說明之；(2)並與其他三名投手之統計值比較之。(請詳述計算過程) 場次各場次ERA

國二EXCEL專案上機考試版本：主講者：黃韋欽老師考試者：國二全體學生.

Dr. C. Hsieh College of Informatics Kao yuan University

新媒体环保公益广告现状调查及发展潜力研究

統計學回顧區國強.

Review of Statistics.

楊志強博士統計學楊志強博士

第7章基本统计分析 2019/5/14.

统计软件应用 4 主讲人陶育纯 SPSS统计分析统计软件应用 4 主讲人陶育纯教案.

统计软件应用 4 主讲人陶育纯 SPSS统计分析统计软件应用 4 主讲人陶育纯教案.

生物统计学 Biostatistics 第一章统计数据的收集与整理

统计工具的使用方法主讲人陶育纯统计工具的使用方法主讲人陶育纯

第七章计量资料的统计分析.

主講人陳陸輝特聘研究員兼主任政治大學選舉研究中心美國密西根州立大學博士

SAS 統計程序實作 PROC MEANS (一個母體)

Presentation transcript:

EXCEL+ORIGN+SPSS的描述统计

100个果丹皮的长度　单位：cm 10.60 10.62 10.64 10.46 10.21 10.50 10.45 10.39 10.36 10.49 10.57 10.44 10.25 10.53 10.48 10.24 10.41 10.30 10.23 10.34 10.40 10.42 10.29 10.28 10.54 10.31 10.32 10.51 10.37 10.35 10.33 10.55 10.58 10.43

一、用ORIGIN进行描述统计(先了解ORIGIN，请参阅ORIGIN介绍文件夹)

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计 (1)Input Data项：右边下拉框可选择是对当前列统计，还是合并整个数据集统计； (2)Quantities to Compute项：打开Moments和Quantiles选中其中的复选框可以选择要计算和显示的统计项，Extreme Values复选框：是否计算显示极大/极小值； (3)Output Results项：输出图形或报表选项； (4)Plots：作图，Histograms复选框：是否计算输出柱状统计图；Box Charts复选框：是否计算输出方框统计图。

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计在通过Quantities to Compute中的设置，Descriptive Statistics项可以显示如下统计项(本章Excel文档有更详细的解释)： (1)N Total：数据点数目； (2)N Missing：缺失的数据点数目； (3)Mean：平均值； (4)Standard Deviation：标准偏差； (5)SE of Mean：平均值的标准误差；

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计 (6)Lower 95% CI of Mean：平均值的95%置信区间的下限； (7)Upper 95% CI of Mean：平均值的95%置信区间的上限； (8)Variance：标准偏差的平方(方差)； (9)Sum：总和； (10)Skeweness：倾斜度数； (11)Kutosis：峰度；

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计 (12)Uncorrected Sum of Squares：未改正的平方和； (13)Coefficient of Variance：变异系数； (14)Mean absolute Deviation：绝对偏差； (15)SD times 2：标准偏差乘以2； (16)SD times 3：标准偏差乘以3； (17)Geometric Mean：几何平均数； (18)Geometric SD：几何标准偏差；

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计 (19)Mode：出现频率最高的数据(众数)； (20)Sum of Weight：权重总和； (21)Minimum：最小值； (22)Index of Minimum：最小值的索引； (23)1st Quartile(Q1)：插值操作时的Q1值(25%)； (24)Median：插值操作时的Q2值(50%)； (25)3rd Quartile(Q3)：插值操作时的Q3值(75%)；

一、用ORIGIN进行描述统计 1. Statistics on Columns列统计 (26)Maximum：最大值； (27)Index of Maximum：最大值的索引； (28)Interquartile Range(Q3-Q1)：插值范围； (29)Rang(Maximum-Minimum) ：极差； (30)Custom Percentile(s)：定制百分位数； (31)Percentile list：是否列出百分位数。

一、用ORIGIN进行描述统计 2. Frequency Counts频率统计频率/频度统计即将数据分成一系列区间，然后分别计算符合区间的数值。使用Statistics→Frequency Count打开对话框。主要参数包括如下内容。(1)Input：数据源；(2)From Minimum：区间最小值；(3)To Maximum：区间最大值；(4)Step by：产生区间段(bins)的方法；包括Increment(增加步长)和Intervals(间隔)；(5)Include Outliers<Minimum：异常值(Outliers)小于最小值时加入到最小区间段；

一、用ORIGIN进行描述统计 2. Frequency Counts频率统计主要参数包括如下内容。(6)Include Outliers>=Maximum：异常值大于最大值时加入到最大区间段；(7)Bin Center：区间段中值；(8)Bin End：区间段结束值；(9)Count：每个区间段计数；(10)CulmuIative Count：积累计数，即将前面的再累加；(11)Relative Frequency：相对频度；(12)Cumulative Frequency：积累频度；(13)Output：输出目标工作表。

Statistics→Frequency Count

Statistics→Frequency Count

Statistics→Frequency Count

一、用ORIGIN进行描述统计 3. Discrete Frequency离散频率统计离散频率统计，可以对各个数据段中数据出现的频率进行统计。执行Statistics→Discrete Frequency命令之后，可以打开Statistics\Descriptive Statistics:discfreqs对话框，其中包括：(1)Frequency复选框：是否统计频率；(2)Percent复选框：是否统计每个频率的百分比；(3)Cumulative Percent复选框：是否统计频率统计的累积百分比；(4)Case Sensitive复选框：是否区分大小写。

一、用ORIGIN进行描述统计 3. Discrete Frequency离散频率统计

一、用ORIGIN进行描述统计 3. Discrete Frequency离散频率统计

一、用ORIGIN进行描述统计 3.Discrete Frequency离散频率统计

一、用ORIGIN进行描述统计 4. Normality Test正态检验正态检验可以测试所统计的数据分布是否符合正态分布。执行Statistics→Normality Test命令之后，可以打开Normality Test对话框，其中包括如下几项。(1)Quantities to Compute：正态检验的方法选择，包括Shapiro-Wilk：是否进行Shapiro-Wilk统计；Kolmogorov-Smirnov：是否进行Kolmogorov-Smirnov统计，选中之后可以从Parameters下拉框中选择参数来源Estimated(从输入数据中获得)、Specified(用户指定)、Mean(平均值)

一、用ORIGIN进行描述统计 4. Normality Test正态检验正态检验可以测试所统计的数据分布是否符合正态分布。执行Statistics→Normality Test命令之后，可以打开Normality Test对话框，其中包括如下几项。和Variance(异常值)；Lilliefors：是否进行Lilliefors统计；(2)Output Results：输出选项；(3)Plot：作图选项。

一、用ORIGIN进行描述统计 4. Normality Test正态检验正态检验可以测试所统计的数据分布是否符合正态分布。执行Statistics→Normality Test命令之后，可以打开Normality Test对话框，其中包括如下几项。和Variance(异常值)；Lilliefors：是否进行Lilliefors统计；(2)Output Results：输出选项；(3)Plot：作图选项。

一、用ORIGIN进行描述统计 4. Normality Test正态检验 SPSS对一组数据进行正态性检验有2种方法，Kolmogorov-Smirnov Test和Shapiro-Wilk Test。Kolmogorov-Smirnov Test检验结果较精确，适用于小样本的检测，而 Shapiro-Wilk Test适用于大样本的检验，本题n=100(<200)，因此属于小样本，因此对因变量y进行正态性检验后利用Kolmogorov-Smirnov Test 的输出结果。

一、用ORIGIN进行描述统计 4. Normality Test正态检验

一、用ORIGIN进行描述统计 4. Normality Test正态检验

一、用ORIGIN进行描述统计 4. Normality Test正态检验 Kolmogorov-Smirnov Test 统计量0.06108，显著水平Sig.=0.91146＞0.05，所以因变量y服从正态分布，即y是正态变量可以进行描述统计分析。

一、用ORIGIN进行描述统计 5.常用的统计图形包括直方图、方框图和质量控制图等。 (1)Histogram直方图选中Worksheet的2个Y列，通过Plot→Statistics→Histogram命令，即可生成直方统计图。这个图形可以清楚地比较不同区间里，数据的出现次数。右键单击图形，选择Go to Bin Worksheet命令，可以弹出一个统计表。另外，选择Properties…命令可以修改图形的外观。

一、用ORIGIN进行描述统计 (1)Histogram直方图

一、用ORIGIN进行描述统计 (2) Histogram+Probabilities概率直方图选中Worksheet的B列，通过Plot→Statistics Graphs→Histogram+Probabilities命令，即可生成概率直方图。其中上面的图为数据的累积出现个数，下面的则为各个区间里数据出现的次数。另外，右键单击图形，选择Go to Bin Worksheet命令，可以弹出一个与直方图一样的统计表。

一、用ORIGIN进行描述统计 (2)Histogram+Probabilities概率直方图

二、用SPSS进行描述统计(先了解SPSS)

二、用SPSS进行描述统计

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率均数：Mean；均数的标准误差：Std. Error of Mean；中位数：Median；众数：Mode；标准差：Std. Deviation；方差：Variance；偏度系数：Skewness；偏度系数的标准误差：Std. Error of Skewness；峰度系数：Kurtosis；峰度系数的标准误差：Std. Error of Kurtosis；极差：全距，Range；最小值：Minimum；最大值：Maximum；总和：Sum；百分位数：percentiles。

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 1.频率

二、用SPSS进行描述统计 2.描述

二、用SPSS进行描述统计 2.描述

二、用SPSS进行描述统计 2.描述

二、用SPSS进行描述统计 2.描述

二、用SPSS进行描述统计 2.描述

三、用EXCEL进行描述统计

三、用EXCEL进行描述统计

描述统计量大致可以分为三类：集中趋势离中趋势分布趋势

反映集中趋势的描述统计量常用的反映集中趋势的描述统计量有五个：算术平均数、调和平均数、几何平均数、中位数和众数。前三个平均数是根据所有标志值计算的，又被称为数值平均数，后两个平均数是根据与其所处位置有关的部分标志值计算的，又被称为位置平均数。

AVERAGE(NUMBER1,NUMBER2,……) 算术平均数算术平均数是数据集中趋势的最主要的统计描述量。计算算术平均数使用AVERAGE函数，格式为： AVERAGE(NUMBER1,NUMBER2,……) NUMBER可以是具体的数值，也可以是单元地址或区域名称。

调和平均数调和平均数 (又称倒数平均数)是数值倒数算术平均值的倒数。在实际工作中，由于所获数据不能直接代入算术平均数的公式中计算，就需要有倒数平均数的形式。计算调和平均数使用HARMEAN函数，格式为： HARMEAN(NUMBER1,NUMBER2,……)

几何平均数几何平均数是N个数值的连乘积，再开N次方根，它是计算平均比率和平均发展速度最适宜的一种方法，因为其数学性质与现象发展的平均速度形成的客观过程相一致。计算几何平均数使用GEOMEAN函数，格式为： GEOMEAN(NUMBER1,NUMBER2,……)

MEDIAN(NUMBER1,NUMBER2,……) 中位数中位数是将全部数值按大小顺序排列后居于中间位置的数值。换句话说，中位数把所有的数值一分为二，有一半数值比它小，另一半数值比它大。计算中位数使用MEDIAN函数，格式为： MEDIAN(NUMBER1,NUMBER2,……)

MODE(NUMBER1,NUMBER2,……) 众数众数是在数列或数据区域中出现频率最多的数值。计算众数使用MODE函数，格式为： MODE(NUMBER1,NUMBER2,……)

反映离中趋势的描述统计量常用的反映离中趋势的描述统计量（简称离中指标）有三个：全距、平均差和标准差（方差）。当对两组数据的差异程度进行相对比较时，往往要计算离散系数，包括全距系数、平均差系数和标准差系数，它等于相应的离中指标除以算术平均数，这样可以消除由于平均数的不同或单位的差异而造成的影响。

全距全距（又称极差）是最大值与最小值之差，用“MAX(ARRAY)—MIN（ARRAY）”求得。ARRAY是指原始资料的存放区域，并且前后应该一致。全距最显著的特点是计算简便、含义清晰，实际工作中常用于产品质量的检验和控制，但全距容易受极端值的影响。

平均差平均差是各个数据与其算术平均数离差绝对值的算术平均数。计算平均差使用AVEDEV函数，格式为：AVEDEV(NUMBER1,NUMBER2,……) NUMBER可以是具体的数值，也可以是单元地址或区域名称。例：AVEDEV(4, 5, 6, 7, 5, 4, 3) ＝ 1.020408

标准差标准差用于反映相对于算术平均数的离散程度。计算标准差的函数有两个，一是STDEV函数，二是STDEVP函数。两者的参数是完全一致的，只是计算的公式略有一点不同。格式为： STDEV (NUMBER1,NUMBER2,……) STDEVP(NUMBER1,NUMBER2,……)

方差方差是标准差的平方，它也是衡量离散程度的重要指标。计算方差有两个函数，前者是计算样本方差的，后者是计算总体方差的。格式为： VAR (NUMBER1,NUMBER2,……) VARP(NUMBER1,NUMBER2,……)。

反映分布趋势的描述统计量常用的反映分布趋势的描述统计量有两个：偏斜度峰值

偏斜度偏斜度反映以平均值为中心的分布的不对称程度。计算偏斜度使用SKEW函数，格式为：SKEW(NUMBER1,NUMBER2,……)

峰度峰度反映与正态分布相比某一分布的尖锐度或平坦度。计算峰度使用KURT函数，格式为：KURT(NUMBER1,NUMBER2,……)

三、用EXCEL进行描述统计平均 10.3952 标准误差 0.010117971 中位数 10.395 众数 10.4 标准差 0.101179708 方差 0.010237333 峰度 -0.525357096 偏度 0.123065672 区域 0.43 最小值 10.21 最大值 10.64 求和 1039.52 观测数 100 最大(1) 最小(1) 置信度(95.0%) 0.020076249

编制次数分布表的步骤 (1)整列：将所取得的原始数据给予顺序排列，数值小的在前面，数值大的在后面。 (2)求极差： (3)分组：100个变量可分7～9组或9～12组。可用公式(K=1+(lgn/lg2))来确定组数。 (4)确定组距：组距是指上一组与下一组的数值之间的差值，通常用i表示。组距一般用整数。如本例中取9组，全距为0.43cm，则组距为：i＝R/组数＝0.43/9＝0.048≈0.05(cm)

编制次数分布表的步骤 (5)确定组限与组中值：组限就是各组的变异范围，即各组的上、下限。组中最小的数值称下限；最大的数值称上限。第一组的下限不应由资料中最小的数值开始，而最小的数值则包含在第一组内。同理，最后一组的上限就避免以最大的数值结束，其最大的数值则应包括在最后一组内。

编制次数分布表的步骤 (5) 另外，组限的小数点位数应比数据的小数点位数多一位，这样才能避免数据重复划。上限与下限的平均数称为组中值。用以代表该组所有变数的平均数。组中值应尽量采用整数，以便于计算。组中值加、减二分之一组距，便分别得到该组的上、下限。首先确定第一组的组中值，确定之后，其它各组的组中值及组限便可以依照组距为等级差数依次推出。

编制次数分布表的步骤 (6)计算各组变量所出现的次数：将各组上、下限内所包括的变数分别归入各组，计算各组变量所出现的次数。一般先用记号“正数”计数，然后按记号统计次数，制成次数分布表如下表所示。

100个果丹皮的长度次数分布表组限组中值记号次数(f) 相对次数/% 累计次数/% 10.195～10.244 10.22 正＋3 8 10.245～10.294 10.27 正正＋1 11 19 10.295～10.344 10.32 正正＋3 13 32 10.345～10.394 10.37 正正正＋3 18 50 10.395～10.444 10.42 68 10.445～10.494 10.47 正正正 15 83 10.495～10.544 10.52 正正 10 93 10.545～10.594 10.57 ＋4 4 97 10.595～10.644 10.62 ＋3 3 100

编制次数分布表的步骤从次数分布表中可以看出，果丹皮长度在10.195～10.444cm。为方便起见，可制成次数分布图。次数分布图有方柱形图和多边形图。