Presentation is loading. Please wait.

Presentation is loading. Please wait.

第七章 调查数据的分析 第一节 数据集中趋势的测定 第二节 数据离散程度的测定 第三节 动态数据的分析 第四节 相关与回归分析.

Similar presentations


Presentation on theme: "第七章 调查数据的分析 第一节 数据集中趋势的测定 第二节 数据离散程度的测定 第三节 动态数据的分析 第四节 相关与回归分析."— Presentation transcript:

1 第七章 调查数据的分析 第一节 数据集中趋势的测定 第二节 数据离散程度的测定 第三节 动态数据的分析 第四节 相关与回归分析

2 第一节 数据集中趋势的测度 一、均值 二、中位数 三、众数 9

3 一、均值 (mean) 1、集中趋势的最常用测度值 2、易受极端值的影响 3、 用于数值型数据,不能用于分类数据和顺序数据

4 (一)简单均值 (simple mean) 设一组数据为: x1 ,x2 ,… ,xn,则

5 (二) 加权均值 (weighted mean)
设一组数据为: x1 ,x2 ,… ,xk 相应的频数为: f1 , f2 ,… ,fk,则

6 加权均值例题1 按年龄分组(岁)xi 人数 fi Xifi 18 15 270 19 33 627 20 12 240 21 10 210
合计 70 1347

7 加权均值例题2

8 二、中位数 (median) 1、将数据排序后处于中间位置上的值。 50% 3、可以用于顺序数据和数值型数据,但不能用于分类数据
2、不受极端值的影响 3、可以用于顺序数据和数值型数据,但不能用于分类数据

9 未分组数值型数据的中位数  中位数  1080 【例】 9个家庭的人均月收入数据
【例】 9个家庭的人均月收入数据 原始数据: 排 序: 位 置: 中位数  1080

10 分组数据中位数的确定 首先确定中位数组,然后用下列公式计算:

11 三、众数 (mode) 1、一组数据中出现次数最多的变量值 2、不受极端值的影响 3、一组数据可能没有众数或有几个众数

12 众数的计算公式 下限公式: 下限公式:

13 四、众数、中位数和均值的关系 右偏分布 左偏分布 对称分布 众数 中位数 均值 均值 中位数 众数 均值 = 中位数 众数 Shape
Concerned with extent to which values are symmetrically distributed. Kurtosis The extent to which a distribution is peaked (flatter or taller). For example, a distribution could be more peaked than a normal distribution (still may be 慴ell-shaped). If values are negative, then distribution is less peaked than a normal distribution. Skew The extent to which a distribution is symmetric or has a tail. Values are 0 if normal distribution. If the values are negative, then negative or left-skewed.

14 众数、中位数、均值的特点和应用 1、众数 不受极端值影响 具有不惟一性 数据分布偏斜程度较大时应用 2、中位数 3、均值 易受极端值影响
数据对称分布或接近对称分布时应用

15 第二节 数据离散程度的测度 一、极差 二、异众比率 三、平均差 四、方差和标准差 五、标准差系数 9

16 一、极差 (range) 1、一组数据的最大值与最小值之差 计算公式为:R = max(xi) - min(xi)
2、离散程度的最简单测度值 3、易受极端值影响

17 例题 两组数据的平均数均为1600,但极差差别较大,因此,第一组数据的差异程度较小,平均数代表性比第二组大。

18 二、异众比率 异众比率:非众数组次数与总次数之比。 用来衡量众数的代表性。

19 三、平均差 各变量值与其均值离差绝对值的算术平均数。 反映了各变量值与均值的平均差异。 计算公式为: 未分组数据: 分组数据:

20 四、方差和标准差 标准差:各变量值与其均值离差平方的算术平均数的平方根。 1、最常用的测度值。 2、反映了各变量值与均值的平均差异。

21 标准差的计算 例题1(未分组数据) 要求:计算该组数据的标准差。 已知以下数据:
要求:计算该组数据的标准差。

22 例题2(分组数据) 某班学生年龄分布情况如下: 年龄 人数 频率(%) 18 19 20 21 30 13 6 1 60 26 12 2
合计 50 100

23 计算过程如下

24 例题3(分组数据) 工资(元) 人数 频率(%) 1000-2000 30 2000-3000 42 3000-4000 20 4000以上
8 合计 100

25 计算过程表格 工资(元) 人数 频率(%) 1000-2000 30 33708000 337080 2000-3000 42 151200
20 176720 4000以上 8 301088 合计 100 816400

26 计算过程 :

27 五、标准差系数 标准差系数:标准差与其相应的均值之比。

28 标准差系数 (例题分析) 【 例 】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度。
标准差系数 (例题分析) 【 例 】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度。 某管理局所属8家企业的产品销售数据 企业编号 产品销售额(万元) x1 销售利润(万元) x2 1 2 3 4 5 6 7 8 170 220 390 430 480 650 950 1000 8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0

29 标准差系数 (例题分析) v1= 536.25 309.19 =0.577 v2= 23.09 =0.710 结论: 计算结果表明,v1<v2,说明产品销售额的离散程度小于销售利润的离散程度。

30 第三节 动态数据的分析 一、 水平分析指标 二、 速度分析指标 三、 长期趋势的分析

31 一、 水平分析指标 (一)发展水平 (二)平均发展水平 (三)增长量 (四)平均增长量

32 (一)发展水平 现象在不同时间上的观察值。说明现象在某一时间上所达到的水平。 按照发展水平在序列中的位置可分为最初水平、最末水平和中间水平。
按照研究目的分为基期水平和报告期水平(计算期水平)。

33 (二)平均发展水平 1、概念: 也称为序时平均数,是对不同时间 发展水平求平均数。

34 2、 序时平均数的计算 (1)绝对数时间数列的序时平均数 时期数列的序时平均数

35 2、序时平均数的计算 时点数列的序时平均数 连续变动的连续时点数列 非连续变动的连续时点数列

36 2、序时平均数的计算 间隔相等的间断时点资料

37 2、序时平均数的计算 间隔不等的间断时点资料

38 2、序时平均数的计算 (2)相对数或平均数时间序列的序时平均数

39 (三)增长量 2、分类: 逐期增长量:报告期水平与前期水平之差 累计增长量:报告期水平与固定时期水平之差
1、概念:报告期水平与基期水平之差,说明现象在一定时期内增长的绝对数量。 2、分类: 逐期增长量:报告期水平与前期水平之差 累计增长量:报告期水平与固定时期水平之差

40 设时间数列中各期发展水平为: 逐期增长量 累计增长量 二者的关系:

41 (四)平均增长量 观察期内各逐期增长量的平均数,描述现象在一定时期内平均每期增长的数量。 计算公式为

42

43 二、速度分析指标 (一)发展速度 (二)增长速度 (三)平均发展速度和平均增长速度 (四)增长1%的绝对值

44 (一)发展速度 1、概念:报告期水平与基期水平之比,说明现象在一定时期内相对的发展程度。 2、分类:
环比发展速度:报告期水平与前一期水平 的比值。 定基发展速度:报告期水平与固定时期水平的比值。

45 (1)各环比发展速度的连乘积等于相应期的定基发展速度
3、环比发展速度与定基发展速度的关系: (1)各环比发展速度的连乘积等于相应期的定基发展速度 (2)两个相邻的定基发展速度,用后者除以前者,等于相应时期的环比发展速度

46 (二)增长速度 环比增长速度=环比发展速度—1 定基增长速度=定基发展速度—1

47 (三)平均发展速度和平均增长速度 1、概念: 平均发展速度:各环比发展速度的平均数,说明现象每期变动的平均程度 。
平均增长速度:说明现象逐期增长的平均程度。

48 2、计算 (1)几何平均法(水平法) 特点:着眼于期末水平

49 算例 某企业总产值资料: 基年 第1年 第2年 第3年 第4年 第5年 总产值(万元) 270.1 273.80 289.20 314.40
322.30 340.70 环比发展速度(%) - 101.37 101.62 108.71 102.51 105.71 定基发展速度(%) 107.07 116.40 119.33 126.14

50

51 (2)方程式法(累计法)

52 算例 【例】某公司2010年实现利润15万元,计划今后三年共实现利润60万元,求该公司利润应按多大速度增长才能达到目的。 解:

53 累计法查对表 各年发展水平总和为基期的﹪ … 平均每年增长﹪ 1年 2年 3年 4年 5年 14.9 114.90 246.92
398.61 572.90 773.17 15.0 115.00 247.25 399.34 574.24 991.04 15.1 115.10 247.58 400.06 575.57

54 (四)增长1%的绝对值 说明速度每增长一个百分点而增加的绝对量,用于弥补速度分析中的局限性。 计算公式为:

55 例:假定有两个生产条件基本相同的企业,各年的利润额及有关的速度值如下表:
甲、乙两个企业的有关资料 年 份 甲 企 业 乙 企 业 利润额(万元) 增长率(%) 2003 5000 60 2004 6000 20 84 40 速度高可能掩盖低水平,低速度可能隐藏着高水平,因此要结合基期水平进行分析。 甲企业2004年增长1%绝对值=5000/100=5 0万元 乙企业2004年增长1%绝对值=60/100=0.6万元

56 三、长期趋势的分析 (一)时距扩大法 (二)移动平均法 (三)配合趋势模型法

57 (一)时距扩大法 把时间序列中各期指标数值按较长的时距加以归并,形成一个新的时间序列,以消除原数列中各种偶然因素的影响,呈现出现象的长期趋势。

58 例:某企业某年各月产值资料 (单位:万元)
月份 1 2 3 4 5 6 7 8 9 10 11 12 产值 323 247 314 318 298 347 335 320 344 326 358 351

59 某企业某年各季产值资料 (单位:万元) 季度 1 2 3 4 产值 884 963 999 1035

60 (二)移动平均法 1、基本原理: 消除时间序列中的不规则变动和其他变动,揭示出时间序列的长期趋势 。 2、移动平均方式:
选择一定的用于平均的时距项数N,采用对序列逐项递移的方式,对原序列递移的 N项计算一系列序时平均数。

61 3、移动平均法的特点 (1)对原序列有修匀或平滑的作用。时距项 数N越大,对数列的修匀作用越强。 (2)移动平均项数为偶数时,需移正。
(4)移动平均会使原序列失去部分信息,平 均项数越大,失去的信息越多。

62 例:某企业商品销售量数据 年份 销售量(台) 4年移动平均数 5年移动平均数 1994 1995 1996 1997 1998 1999
2000 2001 2002 2003 2004 2005 2006 2007 2008 300 600 400 700 800 900 1200 1000 1400 1300 1600 562.5 625 687.5 762.5 775 875 962.5 1025 1112.5 1375 560 620 680 760 860 940 1040 1140 1240 1360

63 (三)配合趋势模型法 通过数学方法对时间数列配合一个合适的趋势方程 ,使其与原数列达到最优拟合。

64 趋势模型法的基本程序 计算趋势值及预测 判断趋势类型 计算待定参数 定性分析

65 长期趋势类型 直线趋势方程: 曲线趋势方程: ……

66 第四节 相关与回归分析 一、 相关与回归的基本问题 二、相关与回归分析

67 一、 相关与回归的基本问题 (一)变量间的关系 (二)相关关系的类型 (三)相关关系分析方法与步骤

68 (一)变量间的关系 确定性的函数关系:Y=f(X) 不确定性的统计关系---相关关系

69 (二)相关关系的类型 按照涉及的变量多少: 简单相关 复相关 按照变量相关关系的表现形式分为 线性相关——散布图接近一条直线
非线性相关——散布图接近一条曲线 按照变量相关关系变化的方向分为 正相关——变量同方向变化(同增同减) 负相关——变量反方向变化(一增一减)

70 (二)相关关系分析方法与步骤 1、相关关系的分析方法 (1)相关分析 分析变量之间相关形态及相关程度 ( 2)回归分析
确定变量间相关的具体数学形式

71 2、相关关系的分析步骤 1)定性分析变量之间是否存在相关关系; 2)分析变量间相关的方向、形态等; 3)测定相关的程度——相关系数; 4)拟合回归方程式,说明变量间的数学关系; 5)对回归方程的拟合程度进行测定。

72 二、 相关与回归分析 (一)相关分析 1、相关表 (1)简单相关表 (2)分组相关表

73 2、相关图 正线性相关 负线性相关 非线性相关 不相关

74 3、相关系数 1、对变量之间关系密切程度的度量。 2、对两个变量之间线性相关程度的度量称为简单相关系数。

75 简单相关系数的计算

76 相关系数的特点 相关系数的取值在-1与1之间。 当r=0时,表明X与Y没有线性相关关系。 当 时,表明X与Y存在一定的线性相关关系:

77 (二)一元线性回归分析 1、基本形式: 2、回归系数估计:

78 例:7家饮料公司的广告支出与销售量数据如下:
要求:1)建立线性回归方程(以广告支出为自变量); 2)预测当广告支出为7000万元时的销售量。

79 例题计算


Download ppt "第七章 调查数据的分析 第一节 数据集中趋势的测定 第二节 数据离散程度的测定 第三节 动态数据的分析 第四节 相关与回归分析."

Similar presentations


Ads by Google