第七章 调查数据的分析 第一节 数据集中趋势的测定 第二节 数据离散程度的测定 第三节 动态数据的分析 第四节 相关与回归分析.

Slides:



Advertisements
Similar presentations
软饮料概述 人文艺术系 石惠舟. 什么是饮料? 饮料概述 饮料是指以水为基本原料,由 不同的配方和制造工艺生产出 来,供人们直接饮用的液体食 品。 饮料 饮料除提供水分外,由于在不 同品种的饮料中含有不等量的 糖、酸、乳以及各种氨基酸、 维生素、无机盐等营养成分, 因此有一定的营养。
Advertisements

2007 年广州市初中信息技术 结业考试海珠区质量分析 海珠区教育发展中心 范谊 2007 年 9 月 8 日.
第五单元 酒水知识与酒吧服务 主题三 蒸 馏 酒 —— 中国蒸馏酒. 蒸馏酒是把经过发酵的酿酒原料,经过一次或多次的蒸馏过 程提取的高酒度酒液。
窦娥冤 关汉卿 感天动地 元·关汉卿.
鬼太郎 身為幽靈族後裔一員的鬼太郎,他出生的時候,父母便雙亡,不過他的爸爸化身為眼珠,陪伴著他。而鬼太郎與他的同伴貓女、臭鼠人等,為了維持妖怪與人類間的和平,他們將一一消滅邪惡的妖怪,守護這世界的和平。
第二章 语言测试的功能与分类 湖南师范大学外国语学院 邓 杰 教授.
會計資訊系統 專章A.
第三章 調整與編表.
复习回顾 … , 1、算术平均数的概念: 一般地,对于n个数 我们把 叫做这n个数的算术平均数,简称平均数. 2、加权平均数的定义
Measures of location and dispersion
第2章 数据处理基础 2.1数据及数据类型 2.2 数据统计特性 2.3 数据预处理 2.4 相似性度量 据的中心度量
MORE THAN HONEY 采 得 百 花 成 蜜 后 吕超逸
知其不可而为之.
8+2-3=? 統計 吳函儒、李雅芳 吳秉蓉、王農景 - =
中国画家协会理事、安徽省美术家协会会员、 工艺美术师、黄山市邮协常务理事余承平主讲
如何定义和确定参考区间 郭健 卫生部北京医院.
More『2』莊園 1+1 MORE 2 的秘密.
汉字的构造.
诵读欣赏 古代诗词三首.
統計學 郭信霖 許淑卿.
心跳加快 安靜且無發燒時,心跳每分鐘120次以上 肌躍型抽搐 (睡眠中無故驚嚇/突然間肌肉收縮)
我的過動人生 圖.文: 吳沁婕.
关于全国高校数学微课程 教学设计竞赛 林亚南 2015年12月12日.
第三章 资料的统计描述 上一张 下一张 主 页 退 出.
3.1 集中趋势的度量 3.2 离散程度的度量 3.3 偏态与峰态的度量
講師:聯捷聯合會計師事務所 張志勝會計師(所長)
恩典更新 羅15:1-13.
常用化学试剂安全培训.
贴近教学 服务师生 方便老师.
六年级 语文 下册 第四单元 指尖的世界.
成员名单 陈丽 陈敏 杨娇 高丽莉 李亚金 吴沅娟 任津沙 张舒蓉.
(浙教版)四年级品德与社会下册 共同生活的世界 第四单元 世界之窗 第二课时.
Population proportion and sample proportion
6.2 常態機率分配 常態機率分配(normal probability distribution)可以說是最重要的連續機率分配。
第十四章 数值变量的统计描述.
第七章 SPSS的非参数检验.
Continuous Probability Distributions
第 5 章 樣本資料的數值分布.
Properties of Continuous probability distributions
Continuous Probability Distributions
Sampling Theory and Some Important Sampling Distributions
Homework 4.
STATA 7 蘇國賢.
第一章 敘述統計學.
第七章 差分方程模型 7.1 市场经济中的蛛网模型 7.2 减肥计划——节食与运动 7.3 差分形式的阻滞增长模型
統計量數 集中趨勢量數 離散趨勢量數 相對位置量數 分配形態量數.
敍述統計學 許明宗.
第 3 章 敘述統計II:數值方法 Part A (3.1~3.2).
雨後的濕地 夜晚的落葉層 清晨的姑婆芋下   你可能曾經和這個小精靈錯身而過…… 遇見蝸牛百分百 《蝸牛不思議》/遠流出版.
第一次上統計Tutorial 就上手 不是只有上一次嗎.
描述性统计学 作者 Dr. Maria Correa-Prisant 翻译 lvruiqin(DXY)
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第八章 假設之檢定與信賴區間 陳順宇 教授 成功大學統計系.
Homework 1(1/2) 本頁表格為派密(Peavy)在07年球季各場次ERA的表現,(1)請依此數據完成下頁表格之統計值並說明之;(2)並與其他三名投手之統計值比較之。(請詳述計算過程) 場次 各場次ERA
Dr. C. Hsieh College of Informatics Kao yuan University
第三章 平均数、标准差与变异系数 第一节 平均数 上一张 下一张 主 页 退 出.
第四章 集中趋势测量法 算术平均数 主 要 内 容 中位数 众数 几何平均数和调和平均数.
Chapter 5 z-Scores.
The Bernoulli Distribution
总体特征数的估计.
单元17 钢 结 构 学习目标 (1)了解钢结构的特点。 (2)了解钢结构的发展现状。 (3)掌握钢结构的链接方式。
五.連續變數及常態分佈 (Continuous Random Variables and Normal Distribution)
(四)标准差(standard deviation)
楊志強 博士 統計學 楊志強 博士
第四章 常用概率分布 韩国君 教授.
汽车电器与控制设备 第0章 绪论.
Xián 伯 牙 绝 弦 安徽淮南市八公山区第二小学 陈燕朵.
生物统计学 Biostatistics 第一章 统计数据的收集与整理
第四章 買賣業會計.
Gaussian Process Ruohua Shi Meeting
Presentation transcript:

第七章 调查数据的分析 第一节 数据集中趋势的测定 第二节 数据离散程度的测定 第三节 动态数据的分析 第四节 相关与回归分析

第一节 数据集中趋势的测度 一、均值 二、中位数 三、众数 9

一、均值 (mean) 1、集中趋势的最常用测度值 2、易受极端值的影响 3、 用于数值型数据,不能用于分类数据和顺序数据

(一)简单均值 (simple mean) 设一组数据为: x1 ,x2 ,… ,xn,则

(二) 加权均值 (weighted mean) 设一组数据为: x1 ,x2 ,… ,xk 相应的频数为: f1 , f2 ,… ,fk,则

加权均值例题1 按年龄分组(岁)xi 人数 fi Xifi 18 15 270 19 33 627 20 12 240 21 10 210 合计 70 1347

加权均值例题2

二、中位数 (median) 1、将数据排序后处于中间位置上的值。 50% 3、可以用于顺序数据和数值型数据,但不能用于分类数据 2、不受极端值的影响 3、可以用于顺序数据和数值型数据,但不能用于分类数据

未分组数值型数据的中位数  中位数  1080 【例】 9个家庭的人均月收入数据 【例】 9个家庭的人均月收入数据 原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000 位 置: 1 2 3 4 5 6 7 8 9  中位数  1080

分组数据中位数的确定 首先确定中位数组,然后用下列公式计算: 或

三、众数 (mode) 1、一组数据中出现次数最多的变量值 2、不受极端值的影响 3、一组数据可能没有众数或有几个众数

众数的计算公式 下限公式: 下限公式:

四、众数、中位数和均值的关系 右偏分布 左偏分布 对称分布 众数 中位数 均值 均值 中位数 众数 均值 = 中位数 众数 Shape Concerned with extent to which values are symmetrically distributed. Kurtosis The extent to which a distribution is peaked (flatter or taller). For example, a distribution could be more peaked than a normal distribution (still may be 慴ell-shaped). If values are negative, then distribution is less peaked than a normal distribution. Skew The extent to which a distribution is symmetric or has a tail. Values are 0 if normal distribution. If the values are negative, then negative or left-skewed.

众数、中位数、均值的特点和应用 1、众数 不受极端值影响 具有不惟一性 数据分布偏斜程度较大时应用 2、中位数 3、均值 易受极端值影响 数据对称分布或接近对称分布时应用

第二节 数据离散程度的测度 一、极差 二、异众比率 三、平均差 四、方差和标准差 五、标准差系数 9

一、极差 (range) 1、一组数据的最大值与最小值之差 计算公式为:R = max(xi) - min(xi) 2、离散程度的最简单测度值 3、易受极端值影响

例题 1450 1500 1550 1600 1650 1700 1750 900 1200 1400 1600 1800 2000 2300 两组数据的平均数均为1600,但极差差别较大,因此,第一组数据的差异程度较小,平均数代表性比第二组大。

二、异众比率 异众比率:非众数组次数与总次数之比。 用来衡量众数的代表性。

三、平均差 各变量值与其均值离差绝对值的算术平均数。 反映了各变量值与均值的平均差异。 计算公式为: 未分组数据: 分组数据:

四、方差和标准差 标准差:各变量值与其均值离差平方的算术平均数的平方根。 1、最常用的测度值。 2、反映了各变量值与均值的平均差异。

标准差的计算 例题1(未分组数据) 要求:计算该组数据的标准差。 已知以下数据: 900 1200 1400 1600 1800 2000 2300 要求:计算该组数据的标准差。

例题2(分组数据) 某班学生年龄分布情况如下: 年龄 人数 频率(%) 18 19 20 21 30 13 6 1 60 26 12 2 合计 50 100

计算过程如下

例题3(分组数据) 工资(元) 人数 频率(%) 1000-2000 30 2000-3000 42 3000-4000 20 4000以上 8 合计 100

计算过程表格 工资(元) 人数 频率(%) 1000-2000 30 33708000 337080 2000-3000 42 151200 3000-4000 20 17672000 176720 4000以上 8 30108800 301088 合计 100 81640000 816400

计算过程 :

五、标准差系数 标准差系数:标准差与其相应的均值之比。

标准差系数 (例题分析) 【 例 】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度。 标准差系数 (例题分析) 【 例 】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度。 某管理局所属8家企业的产品销售数据 企业编号 产品销售额(万元) x1 销售利润(万元) x2 1 2 3 4 5 6 7 8 170 220 390 430 480 650 950 1000 8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0

标准差系数 (例题分析) v1= 536.25 309.19 =0.577 v2= 32.5215 23.09 =0.710 结论: 计算结果表明,v1<v2,说明产品销售额的离散程度小于销售利润的离散程度。

第三节 动态数据的分析 一、 水平分析指标 二、 速度分析指标 三、 长期趋势的分析

一、 水平分析指标 (一)发展水平 (二)平均发展水平 (三)增长量 (四)平均增长量

(一)发展水平 现象在不同时间上的观察值。说明现象在某一时间上所达到的水平。 按照发展水平在序列中的位置可分为最初水平、最末水平和中间水平。 按照研究目的分为基期水平和报告期水平(计算期水平)。

(二)平均发展水平 1、概念: 也称为序时平均数,是对不同时间 发展水平求平均数。

2、 序时平均数的计算 (1)绝对数时间数列的序时平均数 时期数列的序时平均数

2、序时平均数的计算 时点数列的序时平均数 连续变动的连续时点数列 非连续变动的连续时点数列

2、序时平均数的计算 间隔相等的间断时点资料

2、序时平均数的计算 间隔不等的间断时点资料

2、序时平均数的计算 (2)相对数或平均数时间序列的序时平均数

(三)增长量 2、分类: 逐期增长量:报告期水平与前期水平之差 累计增长量:报告期水平与固定时期水平之差 1、概念:报告期水平与基期水平之差,说明现象在一定时期内增长的绝对数量。 2、分类: 逐期增长量:报告期水平与前期水平之差 累计增长量:报告期水平与固定时期水平之差

设时间数列中各期发展水平为: 逐期增长量 累计增长量 ⒈ ⒉ 二者的关系:

(四)平均增长量 观察期内各逐期增长量的平均数,描述现象在一定时期内平均每期增长的数量。 计算公式为

二、速度分析指标 (一)发展速度 (二)增长速度 (三)平均发展速度和平均增长速度 (四)增长1%的绝对值

(一)发展速度 1、概念:报告期水平与基期水平之比,说明现象在一定时期内相对的发展程度。 2、分类: 环比发展速度:报告期水平与前一期水平 的比值。 定基发展速度:报告期水平与固定时期水平的比值。

(1)各环比发展速度的连乘积等于相应期的定基发展速度 3、环比发展速度与定基发展速度的关系: (1)各环比发展速度的连乘积等于相应期的定基发展速度 (2)两个相邻的定基发展速度,用后者除以前者,等于相应时期的环比发展速度

(二)增长速度 环比增长速度=环比发展速度—1 定基增长速度=定基发展速度—1

(三)平均发展速度和平均增长速度 1、概念: 平均发展速度:各环比发展速度的平均数,说明现象每期变动的平均程度 。 平均增长速度:说明现象逐期增长的平均程度。

2、计算 (1)几何平均法(水平法) 特点:着眼于期末水平

算例 某企业总产值资料: 基年 第1年 第2年 第3年 第4年 第5年 总产值(万元) 270.1 273.80 289.20 314.40 322.30 340.70 环比发展速度(%) - 101.37 101.62 108.71 102.51 105.71 定基发展速度(%) 107.07 116.40 119.33 126.14

(2)方程式法(累计法)

算例 【例】某公司2010年实现利润15万元,计划今后三年共实现利润60万元,求该公司利润应按多大速度增长才能达到目的。 解:

累计法查对表 各年发展水平总和为基期的﹪ … 平均每年增长﹪ 1年 2年 3年 4年 5年 14.9 114.90 246.92 398.61 572.90 773.17 15.0 115.00 247.25 399.34 574.24 991.04 15.1 115.10 247.58 400.06 575.57 1075.57

(四)增长1%的绝对值 说明速度每增长一个百分点而增加的绝对量,用于弥补速度分析中的局限性。 计算公式为:

例:假定有两个生产条件基本相同的企业,各年的利润额及有关的速度值如下表: 甲、乙两个企业的有关资料 年 份 甲 企 业 乙 企 业 利润额(万元) 增长率(%) 2003 5000 — 60 2004 6000 20 84 40 速度高可能掩盖低水平,低速度可能隐藏着高水平,因此要结合基期水平进行分析。 甲企业2004年增长1%绝对值=5000/100=5 0万元 乙企业2004年增长1%绝对值=60/100=0.6万元

三、长期趋势的分析 (一)时距扩大法 (二)移动平均法 (三)配合趋势模型法

(一)时距扩大法 把时间序列中各期指标数值按较长的时距加以归并,形成一个新的时间序列,以消除原数列中各种偶然因素的影响,呈现出现象的长期趋势。

例:某企业某年各月产值资料 (单位:万元) 月份 1 2 3 4 5 6 7 8 9 10 11 12 产值 323 247 314 318 298 347 335 320 344 326 358 351

某企业某年各季产值资料 (单位:万元) 季度 1 2 3 4 产值 884 963 999 1035

(二)移动平均法 1、基本原理: 消除时间序列中的不规则变动和其他变动,揭示出时间序列的长期趋势 。 2、移动平均方式: 选择一定的用于平均的时距项数N,采用对序列逐项递移的方式,对原序列递移的 N项计算一系列序时平均数。

3、移动平均法的特点 (1)对原序列有修匀或平滑的作用。时距项 数N越大,对数列的修匀作用越强。 (2)移动平均项数为偶数时,需移正。 (4)移动平均会使原序列失去部分信息,平 均项数越大,失去的信息越多。

例:某企业商品销售量数据 年份 销售量(台) 4年移动平均数 5年移动平均数 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 300 600 400 700 800 900 1200 1000 1400 1300 1600 — 562.5 625 687.5 762.5 775 875 962.5 1025 1112.5 1375 560 620 680 760 860 940 1040 1140 1240 1360

(三)配合趋势模型法 通过数学方法对时间数列配合一个合适的趋势方程 ,使其与原数列达到最优拟合。

趋势模型法的基本程序 计算趋势值及预测 判断趋势类型 计算待定参数 定性分析

长期趋势类型 直线趋势方程: 曲线趋势方程: ……

第四节 相关与回归分析 一、 相关与回归的基本问题 二、相关与回归分析

一、 相关与回归的基本问题 (一)变量间的关系 (二)相关关系的类型 (三)相关关系分析方法与步骤

(一)变量间的关系 确定性的函数关系:Y=f(X) 不确定性的统计关系---相关关系

(二)相关关系的类型 按照涉及的变量多少: 简单相关 复相关 按照变量相关关系的表现形式分为 线性相关——散布图接近一条直线 非线性相关——散布图接近一条曲线 按照变量相关关系变化的方向分为 正相关——变量同方向变化(同增同减) 负相关——变量反方向变化(一增一减)

(二)相关关系分析方法与步骤 1、相关关系的分析方法 (1)相关分析 分析变量之间相关形态及相关程度 ( 2)回归分析 确定变量间相关的具体数学形式

2、相关关系的分析步骤 1)定性分析变量之间是否存在相关关系; 2)分析变量间相关的方向、形态等; 3)测定相关的程度——相关系数; 4)拟合回归方程式,说明变量间的数学关系; 5)对回归方程的拟合程度进行测定。

二、 相关与回归分析 (一)相关分析 1、相关表 (1)简单相关表 (2)分组相关表

2、相关图  正线性相关  负线性相关  非线性相关  不相关

3、相关系数 1、对变量之间关系密切程度的度量。 2、对两个变量之间线性相关程度的度量称为简单相关系数。

简单相关系数的计算

相关系数的特点 相关系数的取值在-1与1之间。 当r=0时,表明X与Y没有线性相关关系。 当 时,表明X与Y存在一定的线性相关关系:

(二)一元线性回归分析 1、基本形式: 2、回归系数估计:

例:7家饮料公司的广告支出与销售量数据如下: 要求:1)建立线性回归方程(以广告支出为自变量); 2)预测当广告支出为7000万元时的销售量。

例题计算