Download presentation
Presentation is loading. Please wait.
Published by召 单于 Modified 7年之前
1
统计学课件 学习统计学的目的和要求: 理解、掌握有关的基本概念,掌握统计资料的搜集、整理以及分析的方法。掌握抽样推断、动态分析、指数分析基本方法,了解相关与回归分析方法。
2
统计学内容 第一章 总论 第二章 统计调查 第三章 统计资料整理 第四章 综合指标 第五章 动态数列分析 第六章 指数
第一章 总论 第二章 统计调查 第三章 统计资料整理 第四章 综合指标 第五章 动态数列分析 第六章 指数 第七章 相关与回归分析 第八章 抽样推断 第九章 综合复习 第十章 复习题 返回
3
第一章 总论 通过本章学习要求学员了解统计学产生与发展的历史,明确统计学的涵义、研究对象等一些基本问题,重点理解统计学中的几个基本概念。 第一节 统计学的产生和发展 第二节 统计学的基本问题 第三节 统计学中的几个基本概念 返回
4
第一节 统计学的产生与发展 返回 一、统计实践活动的产生与发展 二、古典统计学时期(十七世纪至十八世纪)
三、近代统计学时期(十八世纪末至十九世纪末) 四、现代统计学时期(二十世纪初至今) 返回
5
一、统计实践活动的产生与发展 统计实践活动产生于奴隶社会,当时的统治阶级为了对内统治和对外战争,需要征兵征税,开始了人口、土地和财产的统计。封建社会末期,特别是进入资本主义社会以后,社会生产力迅速发展,统计逐步成为社会分工中的一个独立的部门和专业。同时欧洲出现了一些统计理论著作,标志着统计学的产生。统计学产生后形成不同的学派。 返回
6
二、古典统计学时期(十七世纪至十八世纪)
1、 政治算术学 〈1〉 创始人:威廉.配第 〈2〉产生的背景:当时的英国统治阶级为了管理国家、发展经济、争夺世界霸权,需要了解国内外的社会经济状况,于是在英国产生了政治算术学派。 〈3〉研究方法:从数量方面研究社会经济现象。 2、 国势学派 〈1〉创始人:海尔门.康令 〈2〉产生的背景:当时的德国正处于封建制度解体的时期,统治者要了解国内外的政治经济情况,决定国策,在当时封建制的德国产生了国势学派。 〈3〉研究方法:对国家重要事项的记述,几乎完全偏重于品质方面而忽视了量的分析。 返回
7
三、近代统计学时期(十八世纪末至十九世纪末)
1、数理统计学派 〈1〉创始人:阿道夫.凯特勒 〈2〉产生的背景:当时资本主义国家的自然科学有了很大发展,促使英美统计学界尝试用研究自然的方法研究社会经济现象,并引入概率论,产生了数理统计学派. 〈3〉研究方法:用大数定律从社会经济现象复杂不定的偶然性中寻找其规律性。
8
2 、社会统计学派 (1)创始人:德国的克尼斯 (2)产生的背景:实现了统一的德国,为了发展资本主义、争夺殖民地和海外市场,迫切需要掌握国内外大量的国民经济统计资料,以揭示社会经济现象的规律性,于是在德国形成了社会统计学派。 (3) 研究方法:在对统计资料进行搜集、整理、分析的基础上,明确现象内部的联系和规律性。
9
四、现代统计学时期(二十世纪初至今) (数理统计学和社会统计学)
1、数理统计学 这一时期的数理统计学,在深度和广度上都有了迅速的发展,出现了新的分支和边缘科学,成为现代统计学的主流学派。 2、 社会统计学 这一时期的社会统计学也有所发展,其基本趋势是由实质性科学向方法论科学的转变,但相对缓慢。
10
3、 社会经济统计学 在德国社会统计学的影响下,以前苏联为首的社会主义国家逐步建立和发展了社会经济统计学。其理论和方法曾成功地应用于社会主义的计划经济分析。然而由于当时国际意识形态上的对立,这些国家用武断的方法解决学术上的争议,使得统计科学没有按照科学自身的规律不断进步,因此发展缓慢。 4、 中国的统计学 新中国成立后,输入了苏联的社会经济统计学,虽然曾经发挥了重要作用,但同样进步迟缓。八十年代以后,统计进入了全面改革的新时期,统计方法更加丰富、应用更加广泛,统计学得到了很大的发展。 返回
11
第二节 统计学的基本问题 一、统计学的涵义 统计资料:以文字、图表等形式显示出来,用来说明事物的现状、事物之间的内在联系以及未来发展趋势的数据。 统计工作: 统计工作者搜集、整理、计算分析或推断统计资料的工作过程。 统计学:是一门研究搜集、整理、分析或推断统计资料的方法论性质的科学。 返回
12
二、统计学的研究对象和性质 统计学的研究对象是社会现象和自然现象的数量方面。 就性质而言,统计学是一门适用于自然现象和社会现象的方法论学科。 三、统计学的内容 (一)描述统计学 研究如何搜集、加工处理、显示及计算分析数据的方法。 (二)推断统计学 研究如何根据样本数据推断总体数量特此的方法。
13
四、统计学与其他学科的关系 (一)统计学与数学的关系
1、 统计学与数学的联系表现在统计方法以数学知识为基础。其共同点是两者都为各学科提供研究和探索客观规律的数量方法。 2、 统计学与数学的区别表现在两方面,一是统计研究的量是有计量单位的具体的量,而数学研究的量是没有量纲的抽象的量。二是统计学与数学研究中所使用的逻辑方法不同,统计研究是演绎与归纳的结合,而数学所使用的是纯粹的演绎。 (二)统计学与其他学科的关系 统计方法是一种数量分析工具,它可以帮助其他学科探索各学科内在的数量规律性。但是对这种数量规律性的解释只能由各学科的研究完成。 返回
14
第三节 统计学中的几个基本概念 一、总体与总体单位 二、标志 三、指标 四、变量 返回
15
一、总体与总体单位(总体) (一) 总体 1、 概念 总体是在同一性质基础上结合起来的许多个别事物的整体。 2、种类 (1)有限总体:总体中的单位数是有限的。(2)无限总体:总体中的单位数是无限
16
3、总体的特点 (1)同质性:构成总体的各个单位至少具有某种相同的性质。构成全国所有油田这个总体的各个单位经济职能是相同的,都是进行原油生产和加工的。 (2)大量性:总体是由许多单位组成的,仅仅个别或少数单位不能形成总体。全国所有油田构成的总体,是由许多油田而不是个别油田组成。 (3) 差异性:构成总体的各个单位在诸多方面是不同的。全国所有油田构 成的总体,虽然经济职能相同,但各油田的规模大小、经济效益、职工人数等是不同的。统计研究就是在大量性和同质性的基础上研究总体的差异性的。
17
(二) 总体单位 构成总体的各个单位称为总体单位。 (三) 总体与总体单位不是固定的
(二) 总体单位 构成总体的各个单位称为总体单位。 (三) 总体与总体单位不是固定的 随着研究目的和范围地改变,原来的总体(总体单位)可以变为总体单位(总体)。 返回
18
二、标志 1、 概念。 标志是说明总体单位特征的名称。 2、 种类
1、 概念。 标志是说明总体单位特征的名称。 2、 种类 (1) 品质标志:说明总体单位质的特征,不能用数值表示。如果总体单位是一位学生,性别、籍贯、是否近视等是品质标志。 (2) 数量标志:说明总体单位量的特征,是用数值表示的。年龄、身高、以百分制表示的学习成绩等是学生这个总体单位的数量标志 返回
19
三、指标 (一) 概念。指标是说明总体数量特征的名称及数值。 (二) 种类
(一) 概念。指标是说明总体数量特征的名称及数值。 (二) 种类 1、数量指标:反映总体绝对数量多少的指标。全国所有的人口组成一个总体,2002年末全国总人口128453万人,是一个数量指标。全国所有的工业企业组成一个总体,2002年国内生产总值102398亿元是一个数量指标。其特点是指标数值随总体范围的扩大(缩小)而增大(减小)。 2、质量指标:说明总体内部数量关系和总体一般水平的指标,一般表现为相对数和平均数。全国所有的人口组成一个总体,2002年全国人口出生率、性别比例、平均年龄是质量指标。其特点是指标数值大小不随总体范围的变化而增减。
20
(三)指标体系 1、 概念 具有内在联系的一系列指标构成的整体称为指标体系。 2、 表现形式
1、 概念 具有内在联系的一系列指标构成的整体称为指标体系。 2、 表现形式 (1)以数学公式表现出来的指标体系,如:销售额 = 销售量×销售价格 (2)指标之间仅存在一种间接的相互依存关系,如衡量企业经济效益的若干指标所构成的指标体系。 返回
21
(四) 指标与标志的关系 1、 区别: (1)指标是说明总体特征的,标志是说明总体单位特征的。
(四) 指标与标志的关系 1、 区别: (1)指标是说明总体特征的,标志是说明总体单位特征的。 (2)指标都是用数值表示的,标志有用数值表示的和不用数值表示的。 2、 联系: (1)综合关系,指标数值是总体单位的数量值综合而来的。 (2)转换关系,由于研究目的或范围的变化,原来的总体(总体单位)变成总体单位(总体),相应的指标(标志)就变成标志(指标)
22
四、变量 1、 概念 变量是可变的数量标志。 2、 种类 (1)按数值表现形式的不同,有只能用整数表示的离散型变量(人数、企业数等)和可以取任意小数的连续型变量(销售额、身高等)。 (2)按变量所受影响因素的不同,有影响因素是明确的,可以解释的确定性变量和影响因素是不确定的随机变量。 返回 返回
23
第二章 统计调查 第一节 统计调查方式 第二节 统计调查的具体方法 第三节 统计调查方案 返回
24
第一节 统计调查方式 一、统计报表 (一) 概念:统计报表是按照国家有关法规的规定,自上而下统一布置,自下而上地逐级提供基本统计数据的一种调查方式。 (二) 种类:1、按报送范围不同,有要求调查对象中每个单位都填报的全面报表和只要求调查对象中的一部分单位填报的非全面报表。2、按报送的周期不同,有日报、月报、季报、年报等。3、按报表的内容和性质不同,有国家统计报表、部门统计报表、地方统计报表。
25
二、普查 (一) 概念:普查是为某一特定目的而专门组织的一次性全面调查。 (二) 特点:1、普查通常是一次性或周期性的。
(一) 概念:普查是为某一特定目的而专门组织的一次性全面调查。 (二) 特点:1、普查通常是一次性或周期性的。 2、普查一般需要规定统一的标准调查时间,以避免调查数据的重复或遗漏。标准时间一般定在调查对象比较集中,变动相对较小的时间上。 3 普查数据一般比较准确,规范化程度也较高。 4、 普查的适用对象比较狭窄,只能调查一些最基本、最一般的现象。
26
抽样调查是从总体中随机抽取一部分单位进行调查,根据其调查结果推断总体数量特征的一种非全面调查方法。
三、抽样调查 抽样调查是从总体中随机抽取一部分单位进行调查,根据其调查结果推断总体数量特征的一种非全面调查方法。 四、重点调查 重点调查是从全部单位中选择少数重点单位进行调查,以了解总体的基本情况。 五、典型调查 是从研究对象的全部单位中选择一个或几个少数有代表性的单位进行全面深入的调查,用来揭示同类事物的本质规律性。 返回
27
第二节 统计调查的具体方法 一、观察法 调查者通过实际观察事情发生的经过和结果,得到自己所需要的资料。 二、询问法
第二节 统计调查的具体方法 一、观察法 调查者通过实际观察事情发生的经过和结果,得到自己所需要的资料。 二、询问法 调查者采用各种询问的方式向被调查者了解情况的一种方法。有(1)面谈询问法(2)邮寄法(3)留置问卷法(4)电话法 三、实验法 控制一个或几个变量,调查另外一个市场变量有关资料的方法。 四、报告法 被调查单位按照统一要求和表格形式,向有关部门提供统计资料的方法。 返回
28
第三节 统计调查方案 一、确定调查目的 调查研究所要达到的具体目标,解决的问题,具有的社会经济意义。 二、确定调查对象、调查单位和报告单位
第三节 统计调查方案 一、确定调查目的 调查研究所要达到的具体目标,解决的问题,具有的社会经济意义。 二、确定调查对象、调查单位和报告单位 (1)调查对象:根据调查目的所确定的调查研究的总体。(2)调查单位:构成调查对象的每个单位。(3)报告单位:负责报告调查内容的单位。 返回
29
包括时期资料所属的时期、时点资料所属的时点和调查工作的期限。 五、其他事项 包括调查所采用的方法、组织和实施的具体细则等事项。
三、确定调查内容 调查内容一般调查表或问卷的形式出现。(1)调查表有单一表和一览表。(2)问卷是一种特殊的调查表,其内容是由一系列问句所构成的。问卷通常由说明词、主题问句、作业记录三部分组成。其中主题问句中的问句有开放式、对选式、多项选择式、顺位式等形式。 四、确定调查时间 包括时期资料所属的时期、时点资料所属的时点和调查工作的期限。 五、其他事项 包括调查所采用的方法、组织和实施的具体细则等事项。 返回 返回
30
第三章 统计资料整理 通过本章的学习了解对原始资料进行加工的基本方法,重点掌握统计分组的方法和次数分布表的编制。 第一节 统计资料的预处理
第三章 统计资料整理 通过本章的学习了解对原始资料进行加工的基本方法,重点掌握统计分组的方法和次数分布表的编制。 第一节 统计资料的预处理 第二节 统计分组 第三节 次数分布 第四节 统计表 返回
31
第一节 统计资料的预处理 完整性 原始资料 一、资料的审核 逻辑检查 准确性 计算检查 适用 二手资料 时效 二、资料的排序
32
第二节 统计分组 一、按分组标志个数不同 1、简单分组 2、复合分组 二、按分组标志性质不同 1、按品质标志分组 2、按数量标志分组 返回
33
一、按分组标志个数不同 1、简单分组 把总体只按一个标志分组。 2、复合分组
对同一总体选择两个或两个以上标志层叠起来进行分组。例如,可以 同时选择学科、学制、 性别三个标志对某学院全体在校学生这个总体 进行分组。 返回
34
举例: 理科学生组 文科学生组 本科学生组 本科学生组 男学生组 男学生组 女学生组 女学生组 专科学生组 专科学生组
35
二、按分组标志性质不同 (一)按品质标志分组 按家庭人口数分组 (二)按数量标志分组 1人 1、单项式分组:一个变量值表示 2人
一个组的分组。适用于离散型变量 且变量的取值不多。例如,职工家 庭人口数,其取值不可能很多,且 每一个取值都可视为一种类型: 按家庭人口数分组 1人 2人 3人 4人 5人 6人
36
2、组距式分组 凡是用一定范围内的两个变量值表示一个组的分组。适用于连续型变量或虽为离散型变量但取值很多,不便一一列举的情况。
1)连续型变量的组距式分组 如对商店按销售额进行分组 : 按销售额分组(万元) 50以下 50—200 200—400 400—600 600—800 800以上
37
2)离散型变量的组距式分组 如对某企业的20生产小组按人数分组: 生产小组 按人数分组(人) 5—10 11—16 17—22
38
3)组距式分组中的有关问题 (1)等距分组和异距分组 (2)开口组和闭口组 (3)上限、下限、组距 (4) (闭口组) (缺上限的开口组)
(4) (闭口组) (缺上限的开口组) (缺下限的开口组) 返回
39
第三节 次数分布 一、次数分布的概念 在统计分组的基础上将总体的所有单位按组归类,并把所有的组及其单位数按一定顺序排列起来,用以反映总体单位在各组的分布状况。 二、次数分布的表示 (一)列表法 (二)图示法 三、次数分布的主要类型 四、次数分布的编制 返回
40
二、次数分布的表示 (一)列表法 1、某高校学生性别分布表
性 别 人 数(人) 频 率(%) 男 732 57.14 女 549 42.86 合 计 1281 100.00
41
2、某厂工人日产量分布表 按日产量分组(件) 工人数(人) 比 率(%) 9 12 4.00 10 38 12.67 11 65 21.67
比 率(%) 9 12 4.00 10 38 12.67 11 65 21.67 85 28.33 13 60 20.00 14 30 10.00 15 3.33 合 计 300 100.00
42
3、某班学生按考试成绩分组 按成绩分组(分) 人数(人) 比率(%) 60以下 7 8.8 60—70 21 26.2 70—80 25
31.2 80—90 19 23.8 90以上 8 10.0 合 计 80 100.0
43
(二)图示法 1、直方图 (1)单式直方图 2002年我国旅客周转量(亿人公里)
(二)图示法 1、直方图 (1)单式直方图 2002年我国旅客周转量(亿人公里)
44
(2)复式直方图 1998—2002年我国进出口总额(亿美元)
45
2、折线图
46
3、曲线图 返回
47
三、次数分布的主要类型 1、钟型分布 (1)对称的钟型分布
日产量(件)
48
(2)左偏分布 日产量(件)
49
(3)右偏分布 日产量(件)
50
2、U型分布
51
3、J型分布(1) 价格 返回
52
J型分布(2) 价格
53
四、次数分布的编制 例如,某生产车间50名工人日加工零件数如下:
54
组距可以根据(最大值-最小值)÷组数=8来确定, 组距=10 第三步,计算各组次数、频率及累计次数、频率
编制过程 首先,对上面的数据进行排序 第二步,确定组数和组距 组数=4 组距可以根据(最大值-最小值)÷组数=8来确定, 组距=10 第三步,计算各组次数、频率及累计次数、频率
55
50名工人日产零件数次数分布表 按零件数分组 次数 频率(%) 向上累计 向下累计 110以下 3 6 50 100 110—120 13
26 16 32 42 84 120—130 24 48 40 80 20 130—140 10 4 8 合计 — 返回
56
第四节 统计表 一、统计表的结构 (一)外形结构:总标题、横标题、纵标题、数字资料 (二)内容结构:主词、宾词 二、统计表的种类
第四节 统计表 一、统计表的结构 (一)外形结构:总标题、横标题、纵标题、数字资料 (二)内容结构:主词、宾词 二、统计表的种类 (一)简单表 (二)分组表 (三)复合表 返回
57
一、统计表的结构 我国2002年国内生产总值 按三次产业分 国内生产总值 (亿元) 比上年增长率(%) 第一产业 14883 2.9
纵标题 按三次产业分 国内生产总值 (亿元) 比上年增长率(%) 第一产业 14883 2.9 第二产业 52982 9.9 第三产业 34522 7.3 合 计 102398 8.0 横 标 题 数 字 资 料 主 词 宾 词
58
二、统计表的种类 (一)简单表1、我国三个城市的人口数(1990年7月1日0时)
城 市 人口数(人) 较1982年7月1日0时增长% 北京市 17.21 天津市 13.15 上海市 12.50
59
2、我国1998-2002拥有电话户数(万户) 年份 固定电话 移动电话 1998 8742 2386 1999 10872 4330
2000 14483 8453 2001 18037 14522 2002 21442 20662
60
(二)分组表(见表的结构) 返回 (三)复合表 某年末某地区人口资料
(二)分组表(见表的结构) 返回 (三)复合表 某年末某地区人口资料 按城乡及性别分组 人口数(万人) 增长率(%)(与上年比) 城镇人口 男性人口 女性人口 农村人口 合 计 返回 返回
61
第四章 综合指标 通过本章的学习,要求学员在理解总量指标、相对指标、平均指标、变异指标概念的基础上,重点掌握各种指标的计算方法。
第四章 综合指标 通过本章的学习,要求学员在理解总量指标、相对指标、平均指标、变异指标概念的基础上,重点掌握各种指标的计算方法。 第一节 总量指标 第二节 相对指标 第三节 平均指标 第四节 变异指标 返回
62
第一节 总量指标 一、总量指标的概念 总量指标是反映总体的总规模和总水平的综合指标。 二、总量指标的计量单位 自然单位 简单单位
第一节 总量指标 一、总量指标的概念 总量指标是反映总体的总规模和总水平的综合指标。 二、总量指标的计量单位 1、实物单位 自然单位 度量衡单位 简单单位 双重单位 复合单位 2、货币单位 3、劳动单位(工时、工日)
63
三、总量指标的种类 (一)按其所反映的内容不同 1、总体单位总量指标:反映总体中单位数多少的。
2、总体标志总量指标:是反映总体中某种数量标志值总和的。 (二)按其所反映的时间状况不同 1、时期指标:反映现象在某一段时期内的总量。 2、时点指标:反映现象在某一时刻上的总量。 (三)按计量单位的不同 1、实物量指标 2、价值量指标 3、劳动量指标 返回
64
第二节 相对指标 一、相对指标的概念 二、相对指标的表现形式 三、相对指标的种类及计算 (一)结构、比例相对指标 (二)比较、动态相对指标
第二节 相对指标 一、相对指标的概念 二、相对指标的表现形式 三、相对指标的种类及计算 (一)结构、比例相对指标 (二)比较、动态相对指标 (三)强度相对指标 (四)计划完成相对指标 返回
65
一、相对指标的概念 用对比的方法反映某些相关事物之间数量联系程度的指标。 二、相对指标的表现形式 (一)名数 (二)无名数 1、系数和倍数 2、成数 3、百分数 4、千分数 返回
66
三、相对指标的种类及计算(结构、比例) 如: (一) (二)
67
返回
68
(五)强度相对指标 1、基本公式
69
2、作用 (1)反映现象的强弱程度 如: (2)反映现象的密度 (3)反映现象的经济效益 如: 返回
70
(六)计划完成相对指标 1、基本公式 2、短期计划的检查 (1)计划任务数为绝对数
某企业计划规定本年度销售收入达到1000万元,实际为950万元,计划完成相对指标为
71
(2)计划任务数为平均数 某企业计划某种产品单位成本为50元,实际为45元,计划完成相对指标为
72
(3)计划数为相对数 某企业计划劳动生产率今年比去年提高10%,实际提高了15%。计划完成相对指标为 (正指标)
某企业计划劳动生产率今年比去年提高10%,实际提高了15%。计划完成相对指标为 (正指标) 某企业计划某种产品成本今年比去年降低5%,实际降低了6%。计划完成相对指标为 (逆指标)
73
3、中长期计划任务的检查 (1)水平法: 当计划任务是以计划期期末(最后一年)应达到的水平下达的,检查计划执行情况用水平法。
确定提前完成计划的时间:如果计划期内有连续一年的实际数,达到计划规定最后一年应达到的水平,后面所余的时间就是提前完成计划的时间。
74
(2)累计法 当计划任务是以计划期全期累计应达到的水平下达的,检查计划执行情况用累计法。
确定提前完成计划的时间:从计划期开始至某一时间所累计完成的实际数达到了计划规定的累计数,以后的时间就是提前完成计划的时间。 返回
75
第三节 平均指标 平均指标(平均数)是反映现象的一般水平或平均水平的指标。它具有代表性和抽象性。根据掌握资料、研究目的及现象性质不同,有多种计算方法。重点掌握 、H、G。 一、算术平均数 二、调和平均数 三、几何平均数 四、中位数 五、众数 六、切尾平均数和温氏化平均数 七、各种平均数的比较 返回
76
一、算术平均数( ) (一)简单算术平均数 (二)加权算术平均数 1、根据单项数列计算的 2、根据组距数列计算的
一、算术平均数( ) (一)简单算术平均数 (二)加权算术平均数 1、根据单项数列计算的 2、根据组距数列计算的 3、用比重权数计算的加权算术平均数 4、根据相对数(平均数)计算的加权 5、是非标志的平均数 (三) 的数学性质 (四) 的应用条件 返回
77
(一)简单算术平均数 计算公式: 应用条件:资料未分组,各组出现的次数都是1。
举例:5名学生的学习成绩分别为:75、91、64、53、82。则平均成绩为: 返回
78
(二)加权算术平均数 1、根据单项数列计算的
计算公式: 应用条件:单项式分组,各组次数不同。
79
举例 某车间20名工人加工某种零件资料: 按日产量分组(件)x 工人数(人)f 日产总量 xf 14 2 28 15 4 60 16 8
128 17 5 85 18 1 合计 20 319 返回
80
2、根据组距数列计算的 应用条件:组距式分组,各组次数不同。 举例:某车间200名工人日产量资料: 按日产量分组(公斤) 工人数f 组中值x
日产总量xf 20—30 10 25 250 30—40 70 35 2450 40—50 90 45 4150 50—60 30 55 1650 合 计 200 — 8400 返回
81
3、由比重权数计算的 应用条件:已知的是比重权数(次数是比重) 公式: 举例:(仍用上例) 按日产量分组(公斤) 人数比重(%) 组中值x
20—30 5 25 30—40 35 40—50 45 50—60 15 55 返回
82
4、根据相对数(平均数)计算的加权 (1)根据相对数计算的
4、根据相对数(平均数)计算的加权 (1)根据相对数计算的 某局所属的三个企业的资料: 企业 产值计划完成% x 计划产值(万元)f 实际产值(万元)xf 甲 95 300 285 乙 105 900 945 丙 115 345 合 计 — 1500 1575
83
(2)根据平均数计算的 某企业各班组工人劳动生产率资料: 班 组 平均劳动生产率 x 实际工时 f 产品产量(件) xf 一 10 100
班 组 平均劳动生产率 x 实际工时 f 产品产量(件) xf 一 10 100 1000 二 12 200 2400 三 15 300 4500 四 20 6000 五 30 合计 — 1100 19900 返回
84
5、是非标志的平均数 是非标志:如果按照某种标志把总体只能分为具有某种特征的单位和不具有该种特征的单位两部分,这个标志就是是非标志。
平均数的计算:把具有某种特征的用“1”表示,不具有该种特征的用“0”表示。 是非标志 x 单位数 f 比重 1 合 计 N 返回
85
(三)算术平均数的数学性质 1、各个变量值与其平均数离差之和等于零 2、各个变量值与其平均数离差平方之和为最小值
86
性质(3、4) 3、给每个变量值增加或减少一个任意数A,则算术平均数也相应增增加或减少这个任意数A。
返回
87
(四)算术平均数的适用范围 1、当变量值是绝对数时,变量值之间是和的关系,而且已知的是分母资料,在这种情况下,反映现象的平均水平用算术平均数。 2、当变量值是相对数或平均数时,变量值之间既不存在和的关系,也不存在相乘的关系,而且已知的是分母资料,在这种情况下,反映现象的平均水平用算术平均数。 返回
88
二、调和平均数(H) (一)简单调和平均数 计算公式: 应用条件:资料未分组,各个变量值次数都是1。
举例:一个人步行两里,走第一里时速度为每小时候10里,走第二里时为每小时20里,则平均速度为:
89
(二)加权调和平均数 计算公式: 应用条件:资料经过分组,各组次数不同。 例1: x 20 1 15 2 10 3 合计 6 速度 行走里程
m 所需时间 20 1 15 2 10 3 合计 6
90
例2 按日产量分组(件)x 日产总量 m 工人数(人) 14 28 2 15 60 4 16 128 8 17 85 5 18 1 合计
319 20 已 知
91
例3 某局所属的三个企业的资料: 企业 产值计划完成% x 计划产值(万元) 实际产值(万元)m 甲 95 300 285 乙 105
900 945 丙 115 345 合 计 — 1500 1575 已知 已知
92
例4 某车间各班组工人劳动生产率资料: 班 组 平均劳动生产率 x 实际工时 产品产量(件) m 一 10 100 1000 二 12
班 组 平均劳动生产率 x 实际工时 产品产量(件) m 一 10 100 1000 二 12 200 2400 三 15 300 4500 四 20 6000 五 30 合计 — 1100 19900 返回 已知 已知
93
(三)调和平均数的适用范围 1、当变量值是绝对数时,变量值之间是和的关系,而且已知的是分子资料,在这种情况下,反映现象的平均水平用调和平均数。 2、当变量值是相对数或平均数时,变量值之间既不存在和的关系,也不存在相乘的关系,而且已知的是分子资料,在这种情况下,反映现象的平均水平用调和平均数。 返回
94
三、几何平均数(G) (一)简单几何平均数 计算公式: 应用条件:资料未分组(各变量值次数都是1)。
举例:某企业生产某种产品需经过三个连续作业车间才能完成。 车间 投入量 产出量 合格率 % x 一 1000 800 80 二 720 90 三 504 70
95
(二)加权几何平均数 计算公式: 应用条件:资料经过分组,各组次数不同。
举例:将一笔钱存入银行,存期10年,以复利计息,10年的利率分配是第1年至第2年为5%、第3年至5年为8%、第6年至第8年为10%、第9年至第10年12%,计算平均年利率 设本金为 年份 累计存款额 本利率% 第1年 105% 第2年 第3年 108% … 第10年 112%
96
本利率x 年数f 105% 2 108% 3 110% 112% 合 计 10 平均年利率=8.77%
97
(三)几何平均数的适用范围 当变量值是相对数,而且变量值之间存在连乘关系,反映现象的一般水平用几何平均数。 返回
98
四、中位数( ) 把某一标志值按大小顺序排列起来居于中间位置的那个数就是中位数。 (一)由未分组资料确定中位数 1、标志值的个数是奇数
四、中位数( ) 把某一标志值按大小顺序排列起来居于中间位置的那个数就是中位数。 (一)由未分组资料确定中位数 1、标志值的个数是奇数 例:7名工人生产某种产品,日产量(件)分别为4、6、6、8、9、12、14。位于中间位置的第四名( )工人的日产量8件为中位数。 2、标志值的个数是偶数 上例增加为8名工人,日产量为4、6、6、8、9、12、13、14。中位数为 ,其位 置在第四和第五名中间 ( )
99
(二)由单项数列确定中位数 中位数为第40 名和41名日产量的平均值 [ ] 按日产量分组(件)x 工人数(人)f 累计次数 向上累计
例: 中位数为第40 名和41名日产量的平均值 [ ] 按日产量分组(件)x 工人数(人)f 累计次数 向上累计 向下累计 20 10 80 22 15 25 70 24 30 55 26 合计 —
100
(三)由组距数列确定中位数 1、计算公式
101
2、举例 (1)计算累计次数 (2)确定中位数组(6—7) (3)确定中位数数值 1500-720=780(户) 6 X 7
年人均纯收入(千元) 农户数(户) 向上累计次数 5以下 240 5—6 480 720 6—7 1100 1820 7—8 700 2520 8—9 320 2840 9以上 160 3000 合计 — X 返回
102
五、众数( ) 总体中出现次数最多的标志值是众数。 (一)由未分组资料确定众数
五、众数( ) 总体中出现次数最多的标志值是众数。 (一)由未分组资料确定众数 例:7名工人日产量(件)为4、5、6、6、6、7、8。则众数是6。 (二)由单项数列确定众数 按日产量分组(件) 工人数(人) 20 15 21 30 22 23 10
103
(三)由组距数列确定众数 1、计算公式:
104
2、举例 (1)确定众数组 (6—7) (2)计算众数 L x u 年人均纯收入(千元) 农户数(户) 5以下 240 5—6 480
1100 7—8 700 8—9 320 9以上 160 合计 3000 返回
105
第四节 变异指标 变异指标是反映总体各标志值间差异程度的,且能衡量总体平均数的代表性。 一、绝对数形式 (一)全距 (二)平均差
第四节 变异指标 变异指标是反映总体各标志值间差异程度的,且能衡量总体平均数的代表性。 一、绝对数形式 (一)全距 (二)平均差 (三)标准差 (四)适用条件 二、相对数形式 返回
106
一、绝对数形式的变异指标 (一)全距(R) 公式: R =最大值—最小值 优点:计算简便 缺点:易受极端值的影响
107
(二)平均差(A.D) 1、简单平均差 公式: 应用条件:资料未分组,各变量值出现的次数为1。 举例:5名工人日产量资料 日产量(件) 20
3 22 1 23 24 26 合计 8
108
2、加权平均差 公式: 应用条件:资料经过分组,各组次数不同。 举例:前例, 按日产量分组(公斤) 工人数f 组中值x 20—30 10
25 170 30—40 70 35 490 40—50 90 45 270 50—60 30 55 390 合 计 200 — 1320
109
3、平均差的优缺点 优点:平均差是根据全部数值计算的,受极端值影响较全距小。 缺点:由于采取绝对值的方法消除离差的正负号,应用较少。 返回
110
(三)标准差( ) 1、简单标准差 公式: 应用条件:资料未分组,各组次数都是1。 举例:前例, 日产量(件) 20 9 22 1 23
(三)标准差( ) 1、简单标准差 公式: 应用条件:资料未分组,各组次数都是1。 举例:前例, 日产量(件) 20 9 22 1 23 24 26 合计
111
2、加权标准差 公式: 应用条件:资料经过分组,各组次数不同。 举例:前例, 日产量(公斤) 工人数f 组中值x 20—30 10 25
2880 30—40 70 35 3430 40—50 90 45 810 50—60 30 55 5070 合 计 200 — 12190
112
3、是非标志的标准差 如前:是非标志的平均数为P。 标志值x 单位数f 1 合计 N
合计 N 由于标准差有良好的数学性质,相比较而言,它的应用最为广泛。 返回
113
(四)绝对数形式变异指标的适用条件 当两个或多个数列的平均水平相等时,对比数列标志值间的变异程度及平均水平的代表性,用绝对数形式的变异指标。指标值越大,说明变异程度越大,平均水平的代表性越不好;反之亦然。 返回
114
二、相对数形式的变异指标 公式:有全距系数、平均差系数和标准差系数,应用最广泛的是标准差系数,其公式为:
举例:甲组日产量(件)为: 。 乙组日产量(台)为: 。 组别 平均数 标准差 标准差系数% 甲 70(件) 7.07(件) 10.1 乙 7(台) 3.41(台) 48.7
115
相对数形式变异指标的适用条件 当两个或多个数列的平均水平不等时,对比数列标志值间的变异程度及平均水平的代表性,用相对数形式的变异指标。指标值越大,说明变异程度越大,平均水平的代表性越不好;反之亦然。 返回 返回
116
第五章 动态数列分析 本章主要介绍如何根据动态数列进行动态分析,动态分析包括两方面,一是计算各种动态分析指标,反映现象在某一段时期内发展变化的水平和速度。二是测定现象发展变化的规律性,对未来状况作出预测。重点掌握动态分析指标。 第一节 动态数列的概念和种类 第二节 动态分析指标 第三节 动态数列的趋势分析 返回
117
第一节 动态数列的概念和种类 一、概念 将一系列指标数值按时间先后顺序排列起来所形成的数列。 二、种类 (一)绝对数动态数列 1、时期数列
第一节 动态数列的概念和种类 一、概念 将一系列指标数值按时间先后顺序排列起来所形成的数列。 二、种类 (一)绝对数动态数列 1、时期数列 2、时点数列 (二)相对数动态数列 (三)平均数动态数列 返回
118
第二节 动态分析指标 一、动态分析的水平指标 (一)发展水平 (二)平均发展水平 二、动态分析的速度指标 (一)增长量 (二)平均增长量
第二节 动态分析指标 一、动态分析的水平指标 (一)发展水平 (二)平均发展水平 二、动态分析的速度指标 (一)增长量 (二)平均增长量 (三)发展速度 (四)增长速度 (五)增长1%的绝对值 (六)平均发展速度和平均增长速度 返回
119
一、动态分析的水平指标 (一)发展水平 是动态数列中每一项具体的指标数值。 假如动态数列为: 叫最初水平, 叫最末水平。
120
(二)平均发展水平 1、根据绝对数动态数列计算的 <1> 根据时期数列计算的 <2> 根据时点数列计算的
①根据连续性时点数列计算的 间隔相等 间隔不等 ②根据间断性时点数列计算的 2、根据相对数动态数列计算的 3、根据平均数动态数列计算的
121
1、根据绝对数动态数列计算的 〈1〉根据时期数列计算的
例: 年我国国内生产总值(亿元)为 ,则 平均国内生产总值为
122
〈2〉根据时点数列计算的 ①连续性时点数列 某养猪场1—5日生猪存栏头数为 则平均生猪存栏头数为( )÷5=1480(头) 某商品价格自4月11日起从70元降为50元,4月份平均价格 返回
123
②间断性时点数列 间隔相等 4月份平均库存额= 5月份平均库存额= 6月份平均库存额= 第二季度的平均库存额 平均库存额 日期 3.31
4.30 5.31 6.30 库存额(万元) 20 16 18 17.6
124
间隔不等 1月份平均人数= 日期 12.31 1.31 3.31 6.30 人数 1000 1050 1070 1100 2、3月份平均人数= 4、5、6月份平均人数= 返回
125
2、根据相对数动态数列计算的平均发展水平 <1>基本公式
<2>由两个时期数列各对应指标的比值所形成的相对数动态数列计算的平均发展水平 <3>由两个时点数列各对应指标的比值所形成的相对数动态数列计算的平均发展水平 ①由两个连续性时点数列 ②由两个间断性时点数列 <4>由1个时期和1个时点数列各对应指标的比值所形成的相对数动态数列计算的平均发展水平 返回
126
<2>由两个时期数列各对应指标的比值所形成的
平均计划完成% 10月 11月 12月 实际产量(吨)a 500 618 735 计划产量(吨)b 600 700 计划完成%c 100 103 105 返回
127
<2>由两个时点数列各对应指标的比值所形成的 ①由两个连续性时点数列
间隔相等 (公式同时期) 间隔不等 平均非生产人员% 日期 全部人数b 100 110 105 非生产人数a 25 26 24 非生产人员%c 23 间隔日数f 40 27 返回
128
②由两个间断性时点数列 间隔相等 平均生产工人% 间隔不等 日期 1月末 2月末 3月末 4月末 生产工人数a 435 452 462
576 全部工人数b 580 600 720 生产工人%c 75 78 77 80 返回
129
<4>1个时期和1个时点数列各对应指标比值形成的
第四季度平均每人增加值 日期 9月 10月 11月 12月 工业增加值(万元)a 32 34 36 月末人数b 600 612 618 630 返回
130
3、根据平均数动态数列计算的平均发展水平 <1>根据一般平均数计算的
第一季度人均工资 日期 上12月 1月 2月 3月 工资总额(万元)a 12.5 12.8 13.2 月末人数b 200 215 220 240
131
<2>根据序时平均数组成的平均数动态数列
例1:已知各季平均人数为 则全年平均人数为 例2:某企业人数,1月份平均452,2、3月平均455,第二季度平均每月458,则上半年平均人数为 返回
132
二、动态分析的速度指标 (一)增长量 1、公式:增长量=报告期水平—基期水平 2、种类:累计增长量=报告期水平—最初水平
二、动态分析的速度指标 (一)增长量 1、公式:增长量=报告期水平—基期水平 2、种类:累计增长量=报告期水平—最初水平 逐期增长量=报告期水平—前期水平 3、关系:逐期增长量之和等于相应时期累计增长量 相邻两个累计增长量之差等于相应时期逐期增长量 返回
133
(二)平均增长量 返回
134
(三)发展速度 1、公式: 2、种类: 3、关系 返回
135
(四)增长速度 1、公式 2、种类 定基增长速度 环比增长速度 3、关系 增长速度=发展速度-1 返回
136
(五)增长1%的绝对值 指报告期比基期每增长1%所包含的绝对量。 公式 思路 增长速度(%) 增长量 1% x(增长1%绝对值) 返回
137
(六)平均发展速度和平均增长速度(=平均发展速度- 1)
(六)平均发展速度和平均增长速度(=平均发展速度 ) 1、几何平均法 这种方法适宜于如产量、总值等水平指标平均发展速度的计算。 例 某地区1995—2000年粮食产量(万吨)资料 如已知各年产量分别为 则 如已知各年的发展速度为104% 102% 105% 107% 104%则 如已知2000年是1995年的123%则
138
2、方程式法 当 时递增 当 时递减 查相应递增或递减表, 根据 的大小得到平均增长速度。
当 时递增 当 时递减 查相应递增或递减表, 根据 的大小得到平均增长速度。 这种方法适宜于如基本建设投资总额、植树造林总面积等表示国民财产存量的指标平均速度的计算。 返回
139
第三节 动态趋势分析 一、动态数列变动因素的分解与模式 二、长期趋势的测定 (一)时距扩大法 (二)移动平均法 (三)数学模型法
第三节 动态趋势分析 一、动态数列变动因素的分解与模式 二、长期趋势的测定 (一)时距扩大法 (二)移动平均法 (三)数学模型法 三、季节变动的测定 (一)按月(季)平均法 (二)趋势剔除法 返回
140
一、动态数列变动因素的分解与模式 (一)分解
1、长期趋势( ):是现象在一个相当长的时期内持续发展变化的方向性趋势。它是由各个时期普遍起作用的根本性因素所决定的。 2、季节变动(S):是一年以内有一定周期的每年重复出现的变动。它是由季节变换和社会习俗等因素影响而发生的。 3、循环变动(C):指现象因某种原因而发生的周期较长的涨落起伏的波动。 4、不规则变动(I):指由于意外的、临时的、偶然的因素作用而引起的非周期性的或非趋势性的随机变动。 (二)模式
141
二、长期趋势的测定 (一)时距扩大法 某商场某年商品销售额资料(万元) 月份 1 2 3 4 5 6 7 8 9 10 11 12 销售额
二、长期趋势的测定 (一)时距扩大法 某商场某年商品销售额资料(万元) 月份 1 2 3 4 5 6 7 8 9 10 11 12 销售额 50 55 48 46 56 57 52 54 60 66 指标 一季 二季 三季 四季 商品销售额(万元) 153 159 165 180 平均月销售额(万元) 51 53 55 60 返回
142
(二)移动平均法 返回 年份 粮食产量 3年移动 4年移动 4年移正 1993 1994 1995 1996 1997 1998 1999
(二)移动平均法 返回 年份 粮食产量 3年移动 4年移动 4年移正 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2.86 2.83 3.05 3.32 3.21 3.25 3.54 3.87 4.07 3.79 __ 2.91 3.07 3.19 3.26 3.00 3.55 3.82 3.91 3.02 3.09 3.06 3.15
143
(三)数学模型法 1、直线趋势测定 (1)确定动态数列是否有直线趋势。用散点图或一次增量大致相等。 (2)假设方程
(3)计算a、b两个参数。用最小平方法。 从 出发,得到:
144
举例:某地粮食产量(万公斤)资料(计算表)
年份 y t ty 1993 230 1 250 -9 81 -2070 1994 236 2 4 472 -7 49 -1652 1995 241 3 9 723 -5 25 -1205 1996 246 16 984 -3 -738 1997 252 5 1260 -1 -252 1998 257 6 36 1542 1999 262 7 1834 786 2000 276 8 64 2208 1380 2001 281 2529 1967 2002 286 10 100 2860 2574 合计 2567 55 385 14642 330 1047
145
a、b两个参数的计算 把上表第一种编码的有关资料代入方程 2567=10a+b×55 得:14642=55a+b×385
趋势方程为: y= t 预测2003年产量: y= ×11=291.63(万公斤) 把第二种编码资料代入方程: 得: =10a a=256.7 1047=330b b=3.17 趋势方程为: y= t
146
2、曲线趋势的测定(指数曲线) 步骤: (1)确定动态数列是否有指数曲线趋势,用散点图或各期环比速度大致相等。 (2)假设指数曲线方程
(3)计算a、b两个参数 1)把指数曲线转化为直线 ㏒ =㏒a+t㏒b Y=A+Bt 2)计算A、B两个参数(用最小平方法) 3)计算a、b
147
例题(某省发电量资料计算表) 年份 发电量 ㏒y(Y) t t㏒y(tY) 1996 130.37 2.11518 -3 9 -6.3455
1997 146.32 -2 4 1998 147.52 -1 1 1999 167.13 2000 180.50 2.2565 2001 221.83 2 4.6920 2002 267.97 3 7.2843 合计 __ 28 1.3878
148
计算a、b 把上表有关资料代入方程 得 A=2.2433 B=0.0496 查反对数表得 a=175.1 b=1.121 指数曲线方程为
返回
149
三、季节变动的测定(一)按月(季)平均法 (某禽蛋加工厂增加值资料 万元)
三、季节变动的测定(一)按月(季)平均法 (某禽蛋加工厂增加值资料 万元) 月份 1 2 3 4 5 6 7 8 9 10 11 12 第一年 50 80 90 20 60 第二年 15 54 85 93 51 22 75 第三年 88 95 56 23 14 81 第四年 64 99 30 59 25 第五年 70 98 62 32 13 19 61 28 月平均数 87 78 24 季节比率% 43 134 196 213 125 57 31 176 126 53
150
季节比率的计算 季节比率的计算如: 返回
151
(二)移动平均趋势剔除法 (某地保暖内衣零售量 万件)
(二)移动平均趋势剔除法 (某地保暖内衣零售量 万件) 年 份 1999 2000 2001 季度 1 2 3 4 售量(1) __ __ __ __ __ __ __ __ 4项移动平均(2) 4项移正平均(3) 比率%
152
季节比率计算表 % 年份季 第一季度 第二季度 第三季度 第四季度 平均 1999 2000 2001 __ 31 150 149 209
季节比率计算表 % 返回 年份季 第一季度 第二季度 第三季度 第四季度 平均 1999 2000 2001 __ 31 150 149 209 196 20 23 149.5 202.5 21.5 101.2 季节比率 30.7 147.8 200.2 21.3 100 返回
153
第六章 统计指数 通过本章的学习,要求学员在理解指数基本概念的基础上,掌握各种指数的编制及因素分析方法,重点掌握两因素的综合指数因素分析及平均指标指数因素分析。 第一节 指数的基本问题 第二节 综合指数 第三节 平均式指数 第四节 平均指标指数 第五节 指数体系及因素分析 返回
154
第一节 指数基本问题 一、概念 反映不能直接相加的复杂现象综合变动程度的相对数。 二、作用 1、综合反映复杂现象总体数量变动的方向和程度
第一节 指数基本问题 一、概念 反映不能直接相加的复杂现象综合变动程度的相对数。 二、作用 1、综合反映复杂现象总体数量变动的方向和程度 2、利用指数体系进行因素分析 3、根据指数数列反映现象的变动趋势
155
三、指数的种类 (一)按其所说明的对象范围不同 1、个体指数:反映个别现象变动的相对数。如 2、总指数:反映总体现象综合变动的相对数。
(二)按其所反映的指标性质不同 1、数量指标指数 、质量指标指数 (三)总指数按对比的指标形式不同 1、综合指数 、平均式指数 3、平均指标指数 (四)按编制任务不同 1、时间指数 、区域指数 、计划完成程度指数
156
第二节 综合指数 一、综合指数编制的基本方法 (一)数量指数编制方法 (二)质量指数编制方法 二、综合指数的其它编制方法 三、综合指数的应用
第二节 综合指数 一、综合指数编制的基本方法 (一)数量指数编制方法 (二)质量指数编制方法 二、综合指数的其它编制方法 三、综合指数的应用 (一)成本计划完成指数 (二)价格区域指数 返回
157
一、综合指数编制的基本方法 (一)数量指数的编制(某商店资料)
举例:计算三种商品销售量的综合变动程度及由于销售量变动使销售额变动的绝对额。 商品 销量 价格(元) 销售额(元) 甲(公斤) 50 62.5 20 14 1000 1250 乙(套) 75 90 10 8 750 900 丙(件) 100 115 5 500 575 合计 __ 2250 2725
158
数量指数的编制原则 在编制数量指数时,即计算数量指标综合变动程度时,需要加入质量指标作为同度量因素,而且把这个同度量因素固定下来,固定在基期。 返回
159
(二)质量指数编制方法 举例:计算三种商品价格的综合变动程度及由于价格变动使销售额变动的绝对额。 商品 销售量 价格(元) 销售额(元)
甲(公斤) 50 62.5 20 14 875 1250 乙(套) 75 90 10 8 720 900 丙(件) 100 115 5 575 合计 __ 2170 2725
160
质量指数的编制原则 在编制质量指数时,即计算质量指标综合变动程度时,需要加入数量指标作为同度量因素,而且把这个同度量因素固定下来,固定在报告期。 返回
161
二、综合指数的其它编制方法 (一)拉氏公式 (二)派氏公式 (三)马艾公式 (四)费喧公式 (五)固定权数 返回
162
三、综合指数的应用 (一)成本计划完成指数
某企业成本资料 单位成本(元) 产量 总成本(元) 甲(台) 190 195 400 340 7600 78000 乙(件) 44 42 800 1000 35200 33600 合计 — 111200 111600 计算两种产品成本计划综合完成程度及总成本增减额 返回
163
(二)价格区域指数 甲乙两地某日几种农副产品市场资料 商品 甲地区 乙地区 贸易额(元) 1 40 300 50 200 20000
25000 2 30 100 20 12000 8000 3 25 35 1625 合计 — 33625 34625 计算甲乙两地三种产品价格的综合比较程度 返回
164
第三节 平均式指数 一、基本编制方法 (一)加权算术平均式指数 (二)加权调和平均式指数 二、应用 (一)零售物价指数
第三节 平均式指数 一、基本编制方法 (一)加权算术平均式指数 (二)加权调和平均式指数 二、应用 (一)零售物价指数 (二)农产品收购价格指数 (三)工业生产指数 返回
165
一、基本编制方法 (一)加权算术平均式指数
举例 商品 (%) 甲(公斤) 125 1000 1250 乙(套) 120 750 900 丙(件) 115 500 575 合计 __ 2250 2725 计算三种商品销售量的综合变动程度及由于销售量变动使销售额变动的绝对额。
166
加权算术平均式指数的适用条件 计算数量指数时,如果已知的是数量指标的个体指数和基期总额资料,用加权算术平均式指数计算数量指标的综合变动程度。
返回
167
(一)加权调和平均式指数 举例 商品 ( %) 甲(公斤) 70 875 1250 乙(套) 80 720 900 丙(件) 100 575
合计 — 2170 2725 计算三种商品价格的综合变动程度及由于价格变动使销售额变动的绝对额。
168
加权调和平均式指数的适用条件 计算质量指数时,如果已知的是质量指标的个体指数和报告期总额资料,用加权调和平均式指数计算质量指标的综合变动程度。 返回
169
二、平均式指数的应用 (一)零售物价指数 代表品 权数 W 指数(%) 一、食品类 54 135.3 1、粮食 46 149.1 (1)细粮 60 146.1 面粉 标准(公斤) 1.81 2.80 40 154.5 大米 二等(公斤) 1.56 2.20 140.5 (2)粗粮 153.5 2、副食品 42 128.0 3、烟茶酒 8 110.0 4、其它食品 4 103.2 二、衣着类 21 102.0
170
返回
171
(二)农产品收购价格指数 大类 中类 小类 代表品 指数% 万元 甲 (120) 120 A (116) 58 (125) 25 140
110 11 33 B (124) 62 (115) 23 108.3 13 125 10 130 39
172
返回
173
(三)工业生产指数 工业部门 代表品数 W % 制造业 500 60 120 72 矿业 20 25 82 20.5 电信业 30 15
125 18.751 合计 550 100 __ 111.25 返回
174
第四节 平均指标指数 这里的平均指标包括第四章所讲的加权算术平均数和与此相似的相对指标,如全员劳动生产率、人均国内生产总值。所以平均指标指数是反映两个不同时期同一经济内容这类指标的变动程度,即两个时期的加权算术平均数及与此相似的相对指标对比形成的指数。 一、可变构成指数
175
二、固定构成指数 三、结构影响指数
176
某企业工资资料 工人类别 工人数 平均工资(元) 工资总额(万元) 技工 300 500 550 15 16.5 徒工 200 700 350 6 24.5 21 合计 1000 — 41 36 1、计算所有工人总平均工资变动的程度和绝对额
177
2、计算由于各组工资水平的变动使总平均工资变动的程度及绝对额
3、计算由于结构的变动使总平均工资变动的程度及绝对额 返回
178
第五节 指数体系及因素分析 一、指数体系 二、综合指数体系的因素分析 (一)两因素综合指数体系的因素分析 (二)多因素综合指数体系的因素分析
第五节 指数体系及因素分析 一、指数体系 二、综合指数体系的因素分析 (一)两因素综合指数体系的因素分析 (二)多因素综合指数体系的因素分析 三、平均式指数体系的因素分析 四、平均指标指数体系的因素分析 返回
179
一、指数体系 (一)概念 把经济上有联系,数量上保持一定关系的三个或三个以上的指数组成的整体称为指数体系。 (二)种类 1、综合指数体系
(1)两因素 总成本指数=产量指数×单位成本指数 (2)多因素 2、平均指标指数体系 3、两者结合的指数体系 总成本指数=产量指数×单位成本指数 =产量指数×单位成本的固定构成指数 ×单位成本的结构影响指数 原材料费用 总额指数 = 产量 指数 × 单耗 原材料价 格指数
180
二、综合指数体系的因素分析 (一)两因素综合指数体系的因素分析
商品 销量 价格(元) 销售额(元) 甲(公斤) 50 62.5 20 14 1000 1250 875 乙(套) 75 90 10 8 750 900 720 丙(件) 100 115 5 500 575 合计 __ 2250 2725 2170 从相对数和绝对数两方面对销售额的变动进行因素分析
181
从相对数来说,销售额下降了3.56%,是由于销售量上升了21.11%和价格下降了20.37%两个因素共同影响的结果.
销售额指数=销售量指数×价格指数 96.44%=121.11%×79.63% =( )+( ) -80=475+(-555) 计算结果表明: 从相对数来说,销售额下降了3.56%,是由于销售量上升了21.11%和价格下降了20.37%两个因素共同影响的结果. 从绝对数来说,销售额减少了80元,是由于销售量的上升使销售额增加了475元和由于价格下降使销售额减少了555元两个因素共同影响的结果. 接到 返回
182
(二)多因素综合指数体系的因素分析 原材料 产品 生产量 单耗 材料价格 费用总额(百元) 甲(公斤) A (百件) 8 10 0.6
0.5 20 21 96 120 100 105 乙(米) B (百套) 5 1.2 1.1 15 14 90 82.5 77 丙(米) C 12 2.4 2.5 30 28 720 86.4 900 840 合计 __ 906 1074 1082.5 1022
183
从相对数和绝对数两个方面对该企业费用总额的变动进行因素分析
额指数 = 产量 指数 × 单耗 原材料价 格指数 相对数 绝对数 112.8%=118.5%×100.8%×94.4% =( )+( )+( ) 11600(元)=16800(元)+850(元)+(-6050元)
184
计算结果表明: 从相对数来说,该企业费用总额增长了12.8%,是由于产量增长了18.5%,单耗增长0.8%,原材料价格下降5.6%三个因素共同影响的结果。 从绝对数来说,该企业费用总额增加了11600元是由于产量增长使其增加了16800元,单耗增长使其增加850元,原材料价格的下降使其减少了6050元三个因素共同作用的结果。
185
三、平均式指数体系的因素分析 商品 % 甲(公斤) 125 70 1000 875 乙(套) 120 80 750 720 丙(件) 115
500 575 合计 __ 2250 2170 从相对数和绝对数两个方面对销售额的变动进行因素分析 96.44%=121.11%×79.63% =( )+( ) -80=475+(-555) 计算结果表明:(同上)
186
四、平均指标指数体系的因素分析 相对数 97.62%=113.89%×85.71%
返回 97.62%=113.89%×85.71% 计算结果表明:从相对数说,所有工人的总平均工资下降了2.38%,是由于各组工人的平均工资上升了13.89%和结构的影响使平均工资下降了14.29%两个因素共同作用的结果。从绝对数说,总平均工资减少10元,是由于各组工人平均工资的上升使平均工资增加50元和结构的影响使平均工资减少了60元两个因素共同作用的结果。 相对数 绝对数 -10=50+(-60) 返回
187
第七章 相关与回归分析 相关与回归分析是研究现象之间依存关系的一种统计方法。重点掌握简单线性相关系数的计算与分析及一元线性回归方程的建立。
第七章 相关与回归分析 相关与回归分析是研究现象之间依存关系的一种统计方法。重点掌握简单线性相关系数的计算与分析及一元线性回归方程的建立。 第一节 相关与回归分析的基本问题 第二节 简单线性相关分析 第三节 一元线性回归分析 返回
188
第一节 相关与回归分析的基本问题 一、相关的概念 二、相关关系的种类 三、相关与回归分析的的主要内容 返回
189
一、相关的概念 (一)相关分析 从数量上分析现象之间相关关系的理论和方法。 (二)函数关系(确定性关系)
对于某一变量的每个数值都有另一变量的完全确定的值与之对应。 (三)相关关系(非确定性关系) 现象之间存在一定的依存关系,但不是一一对应的关系,即相随变动关系。
190
二、相关关系的种类 (一)按变量之间相关的程度 1、完全相关 2、完全不相关 3、不完全相关 (二)按相关关系涉及变量的多少
1、完全相关 、完全不相关 、不完全相关 (二)按相关关系涉及变量的多少 1、单相关 、复相关 (三)按变量之间相关关系的表现形式 1、线性相关 、非线性相关 (四)对线性相关,按相关的方向 1、正相关 、负相关
191
三、相关与回归分析的主要内容 (一)确定变量之间有无相关关系及呈现的形态 用定性分析、相关表或相关图。 (二)确定变量之间相关关系的密切程度
用相关系数。 (三)建立变量之间变动关系的方程式 用最小平方法建立变量之间的回归方程。 (四)测定因变量估计值的可靠性 计算估计标准误差。 返回
192
第二节 简单线性相关分析 一、相关表 (一)简单相关表 (二)单变量分组相关表 (三)双变量分组相关表 二、相关图 三、相关系数
第二节 简单线性相关分析 一、相关表 (一)简单相关表 (二)单变量分组相关表 (三)双变量分组相关表 二、相关图 三、相关系数 (一)基本公式 (二)性质 (三)其它计算公式 (四)例题 返回
193
一、相关表(一)简单相关表 机床 1 2 3 4 5 6 7 8 9 10 11 使用年限 年维修费用(元) 400 540 520 640
740 600 800 700 760 900 840
194
(二)单变量分组相关表 使用年限 机床数(台) 平均维修费用( ) 2 470 3 1 520 4 690 5 700 6 787 8
平均维修费用( ) 2 470 3 1 520 4 690 5 700 6 787 8 840 9 1080 合计 12 __
195
(三)双变量分组相关表 年维修费用(元) 机床使用年限(年) 合计 2 3 4 5 6 8 9 1000—1100 1 900—1000
800—900 700—800 600—700 500—600 400—500 12
196
二、相关图 使用 年限
197
三、相关系数 (一)基本公式 1、基本公式
198
2、 的作用与不足 (1)说明相关的方向 (2)显示相关程度 y x (3)不足:受变量值个数、变量值大小和计量单位的影响
199
3、 的作用与不足 (1)作用:消除了变量值个数的影响。 (2)不足:协方差数值受变量值大小和计量单位的影响。例: 人均销售额(千元)
3、 的作用与不足 (1)作用:消除了变量值个数的影响。 (2)不足:协方差数值受变量值大小和计量单位的影响。例: 人均销售额(千元) 利润率% 人均销售额(元) 6 12.6 6000 5 10.4 5000 8 18.5 8000 1 3.0 1000 4 8.1 4000
200
4、 的作用 同协方差相比,相关系数有两个作用; (1)它是一个系数,不受变量值水平和计量单位的影响,可以在不同资料之间对相关程度进行对比。
4、 的作用 同协方差相比,相关系数有两个作用; (1)它是一个系数,不受变量值水平和计量单位的影响,可以在不同资料之间对相关程度进行对比。 (2)相关系数的数值有一定范围即
201
(二)相关系数的性质 1、当 时,x与y为完全线性相关,即x 与y之间存在着函数关系。
2、当 时,表示x与y之间存在一定的线性相关。 的数值愈接近于1,表示x与y之间直线相关程度愈高;反之 的数值愈接近于0,表示x与y之间直线相关程度愈低。通常判断的标准是: 微弱相关 低度相关 显著相关 高度相关 3、当r﹥0时,为正相关,当r﹤0时,为负相关。 4、当 时,表示y的变化与x无关,即x与y完全没有直线相关。
202
(三)相关系数的其它计算公式 设 则 举例
203
使用年限x 维修费用(元)y xy 2 540 4 291600 1080 3 520 9 270400 1560 640 16 409600 2560 740 547600 2960 5 600 25 360000 3000 800 640000 4000 6 700 36 490000 4200 760 577600 4560 900 810000 5400 8 840 64 705600 6720 81 116400 9720 合计58 8120 348 45760
204
计算结果表明,机床使用年限与维修费用之间为高度正相关。
返回
205
第三节 一元线性回归分析 一、相关分析与回归分析的关系 (一)区别 (二)联系 二、一元线性回归方程的建立 (一)回归方程的建立
第三节 一元线性回归分析 一、相关分析与回归分析的关系 (一)区别 (二)联系 二、一元线性回归方程的建立 (一)回归方程的建立 (二)r与b的关系 三、估计标准误差 (一)基本公式 (二)计算公式 (三) 与b的关系 返回
206
一、相关分析与回归分析的关系 (一)区别 1、相关分析的任务是确定两个变量之间相关的方向和密切程度。回归分析的任务是寻找因变量对自变量依赖关系的数学表达式。 2、相关分析不必确定两变量中哪个是自变量,哪个是因变量,而回归分析中必须区分因变量与自变量。 3、相关分析中两变量是对等的改变两者的地位,并不影响相关系数的数值,只有一个相关系数。而在回归分析中,互为因果关系的两个变量可以编制两个独立的回归方程。 4、相关分析中两变量可以都是随机的,而回归分析中因变量是随机的,自变量不是随机的。
207
(二)联系 1、相关分析是回归分析的基础和前提。只有在相关分析确定了变量之间存在一定相关关系的基础上建立的回归方程才有意义。
2、回归分析是相关分析的继续和深化。只有建立了回归方程才能表明变量之间的依赖关系,并进一步进行预测。
208
二、一元线性回归方程的建立 (一)回归方程的建立 1、假设回归方程 2、计算a、b两个参数(最小平方法) 从 出发,得到 前例
从 出发,得到 前例 a= ×5.72=368.65
209
(二)b与r的关系 例: r= a=2.8
210
三、估计标准误差 (一)定义公式 (二)计算公式
(三)意义 估计标准误差是说明回归方程代表性大小的统计分析指标。其值小,表明方程代表性大;反之亦然。
211
用上例 a=368.65 b=70.12
212
(四) 与r的关系 可见,当r越大时, 越小,这时相关密切程度较高,回归直线的代表性就大;反之亦然。
实际中,一般不常用这种方法计算r,因为,(1)需要先求出回归直线方程,计算出估计标准误差,才能求得r。不符合一般程序。(2)以这种方法计算的r难以判断是正相关还是负相关。 返回
213
y y x
215
第八章 抽样推断 本章介绍在一定的概率保证程度下,从数量上用样本指标推断总体指标的统计方法。重点掌握简单随机抽样方式下,抽样平均误差计算、抽样单位数目确定和区间估计的方法。 第一节 抽样推断的基本问题 第二节 抽样误差 第三节 抽样单位数目的确定 第四节 抽样估计 返回
216
第一节 抽样推断的基本问题 一、抽样推断的概念 二、抽样推断的特点 三、抽样推断的适用范围 四、抽样推断的有关概念 五、抽样方法 返回
217
一、抽样推断的概念 抽样推断是指从被研究现象的总体中按照随机原则抽取一部分单位进行调查,并依据调查结果对全部研究对象的数量特征作出具有一定可靠程度的估计,以达到对全部研究对象认识的一种统计方法。 二、抽样推断的特点 (一)按照随机原则从总体中抽取样本单位。 (二)用样本单位的指标数值推断总体的指标数值。 (三)抽样误差可以事先计算并加以控制。 三、抽样推断的适用范围(需要掌握总体的具体数据) (一)不能进行全面调查 (二)理论上可以进行全面调查实际上办不到 (三)没有必要进行全面调查 (四)可以验证和补充全面调查资料
218
四、抽样推断的有关概念 (一)全及总体和抽样总体 1、全及总体(总体 N):所要认识对象的全体。 (1)有限总体 (2)无限总体
(1)有限总体 (2)无限总体 2、抽样总体(样本 n):所抽取的一部分单位。 (1)大样本(n≥30) (2)小样本(n≤30) (二)全及指标和抽样指标 1、全及指标:用来描述全及总体的指标 2、抽样指标:根据样本单位计算的指标
219
五、抽样方法 (一)按抽取样本单位的方法不同 1、重复抽样 2、不重复抽样 (二)根据对样本的要求不同 1、考虑顺序的抽样 AB≠BA
1、重复抽样 、不重复抽样 (二)根据对样本的要求不同 1、考虑顺序的抽样 AB≠BA 2、不考虑顺序的抽样 AB=BA 返回 (三)两种分类交叉 1、考虑顺序的不重复抽样 2、考虑顺序的重复抽样 3、不考虑顺序的不重复抽样 4、不考虑顺序的重复抽样
220
第二节 抽样误差 一、抽样平均误差 (一)概念 (二)计算 1、简单随机抽样 2、类型抽样 3、等距抽样 4、整群抽样 5、阶段抽样
第二节 抽样误差 一、抽样平均误差 (一)概念 (二)计算 1、简单随机抽样 2、类型抽样 3、等距抽样 4、整群抽样 5、阶段抽样 (三)影响抽样平均误差的因素 二、抽样极限误差 三、抽样极限误差与抽样平均误差的关系 返回
221
一、抽样平均误差 (一)抽样平均误差的概念 1、登记汇总性误差 2、代表性误差 (1)偏差 (2)随机误差 实际误差 平均误差
222
(二)抽样平均误差的计算 1、简单随机抽样 (1)概念 :是对总体单位不作任何分类或排队,完全按随机原则逐个地抽取样本单位。
(2)抽样平均误差的计算公式 ①平均数的抽样平均误差 ②成数的抽样平均误差
223
在重复抽样下,样本变量是独立的。则
224
(3)例题 ①某冷库冻鸡平均每只重1200克,标准差70克,如果重复随机抽取100只和200只,分别计算抽样平均误差。
②该冷库冻鸡合格率为97%,如果重复随机抽取100只和200只,分别计算抽样平均误差。
225
2、类型抽样 (1)概念:类型抽样是将总体全部单位按某个标志分成若干个类型组,然后从各类型组中采用简单随机抽样方式或其它方式抽取样本单位。
(2)样本单位数在各类型组中的分配方式 ①等额分配:在各类型组中分配同等单位数。 ②等比例分配:按各类型组在总体中所占比例分配样本单位数。即: ③最优分配:按各类型组的规模大小和差异程度,确定各类型组的样本单位数。
226
(3)抽样平均误差的计算公式 ①平均数的抽样平均误差 重复 不重复且等比例 ②成数的抽样平均误差
227
(4)例题 ①有12块小麦地,每块1亩。6块处于丘陵地带,亩产量(斤)分别为: 。 6块处于平原地带,亩产量(斤)分别为: 。抽查4块,测定12块地的平均亩产量,计算其抽样误差。 ②设亩产在350以上的为高产田,抽查4块,测定12块地高产田的比重,计算其抽样误差。 用类型抽样,每类抽2块 计算各组方差 平均组内方差 抽样误差
228
亩产量 300 1600 330 100 340 370 900 合计 3600 亩产量 420 1600 450 100 460 490 900 520 3600 合计 7800 丘陵 平原 ①
229
② 地块数 高产田数 高产田比重% 丘陵 6 2 33.3 66.67 22.2 平原 100
230
3、等距抽样 (1)概念:将总体各单位标志值按某一标志顺序排队,然而按一定的间隔抽取样本单位。 (2)排对的方法
①无关标志排队 ②有关标志排队 (3)抽取样本单位的方法 ①按相等的距离取样 ②对称等距取样 (4)抽取第一个样本单位的方法 ①随机抽取 ②居中抽取
231
(5)抽样平均误差的计算公式 ①按无关标志排队 :同不重复简单随机抽样 ②按有关标志排队
232
(6)例题 上例,抽选间隔为 Ⅰ 亩产量( ):300 330 330 Ⅱ 亩产量( ):340 370 370
Ⅰ 亩产量( ): Ⅱ 亩产量( ): Ⅲ 亩产量( ): Ⅳ 亩产量( ):
233
4、整群抽样 (1)概念:把总体分为若干群,从总体群中抽取若干样本群,对抽中的群进行全数登记调查。 (2)抽样平均误差的计算公式
某水泥厂一昼夜的产量为14400袋,现每隔144分钟抽取1分钟的水泥(10袋)检查平均每袋重量和一级品率,样本资料如下: 计算抽样平均误差 (3)例题
234
样本群 平均每袋重量 一级品比重 1 49 2.25 0.80 2 51 0.25 0.75 0.0025 3 52 0.83 0.0009 4 53 6.25 0.82 0.0004 5 50 6 0.79 0.0001 7 0.78 8 48 9 0.81 10 合计 505 26.25 8.00 0.0048
235
一昼夜有1440分钟,即把总体分为1440群,R=1440 每隔144分钟抽取1分钟的水泥(10袋),r= 10
236
5、阶段抽样 (1)概念:抽样时,先抽总体中较大范围的单位,再从中选的较大范围的单位中抽取较小范围的单位,依此类推,最后得到样本的基本单位。
(2)抽样平均误差的计算公式(以两阶段为例) 同理可以得出成数抽样平均误差的计算公式 (3)例题:某地区有300户居民,分成10群,现从10群中抽6群,再从抽中的群中每群抽2户调查其平均收入,计算抽样平均误差。资料如下: 群1: (户收入) n=rm
237
群2:户收入 群3:户收入 群4:户收入 群5:户收入 群6;户收入
239
(三)影响抽样平均误差的因素 1、总体标准差的大小 2、样本单位数的多少 3、抽样方法的不同 4、抽样组织方式的差别
240
二、抽样极限误差 样本指标围绕总体指标左右两侧波动形成的一定范围。
241
据中心极限定理,当总体为正态或总体非正态但n≥30时,样本均值的分布趋近于正态分布;当n足够大时,样本成数的分布近似为正态分布。
三、抽样极限误差与抽样平均误差的关系 (一)抽样分布 据中心极限定理,当总体为正态或总体非正态但n≥30时,样本均值的分布趋近于正态分布;当n足够大时,样本成数的分布近似为正态分布。 (二)关系 令 返回
242
第三节 抽样单位数目的确定 一、抽样单位数目的计算 (一)简单随机抽样 (二)类型抽样 (三)等距抽样 (四)整群抽样
第三节 抽样单位数目的确定 一、抽样单位数目的计算 (一)简单随机抽样 (二)类型抽样 (三)等距抽样 (四)整群抽样 二、影响抽样单位数目的因素 返回
243
一、 抽样单位数目的计算 (一)简单随机抽样 1、计算公式 (1)平均数 (2)成数
244
2、例题 (1)某类产品根据以往资料的估计,总体方差5.456千克,现对一批进行简单随机抽样以推断该批产品的平均重量,要求可靠程度达到99.73%,误差范围不超过0.9千克,需要抽多少样本单位? 按题意 (2)根据以往资料的估计,该类产品的一等品率为 90%,可靠程度仍为99.73%,误差范围不超过5%,推断该批产品的一等品率,需要抽多少样本单位?
245
(二)类型抽样 1、计算公式 重复抽样 不重复抽样 平均数 成数
246
2、例题 某工厂早、中、晚生产罐头10000瓶,根据以往资料的估计平均重量的类型平均方差为0.549克,合格率的类型平均方差为 ,要求可靠程度为何95%,平均重量的允许误差为0.11克,合格率的允许误差为0.025,用类型抽样推断10000瓶罐头的平均重量和合格率,需要抽多少样本单位? 据题意
247
(三)等距抽样 计算公式 (1)按有关标志排队 同类型重复抽样 (2)按无关标志排队 同简单随机不重复抽样
248
(四)整群抽样 1、计算公式 2、例题:某水泥厂对一昼夜所生产的14400袋(1440群)水泥抽样检查其质量,根据以往资料,水泥平均重量的群间方差为2.65,允许误差为1.5公斤;一级品率的群间方差为 ,允许误差为0.015,要求可靠程度为95.45%,需要抽多少样本群? 据题意:
249
二、影响抽样单位数目的因素 (一)总体各单位的变异程度 (二)抽样推断的准确程度△ (三)抽样推断的可靠程度t (四)抽样的组织形式
(五)抽样的方法 返回
250
第四节 抽样估计 一、估计量的优良标准 二、抽样估计的方法 (一)点估计 (二)区间估计 1、平均数的区间估计 2、成数的区间估计
第四节 抽样估计 一、估计量的优良标准 二、抽样估计的方法 (一)点估计 (二)区间估计 1、平均数的区间估计 2、成数的区间估计 3、2个总体平均数之差的估计 4、两个总体比例之差的估计 返回
251
一、估计量的优良标准 (一)无偏性 1、概念:如果样本统计量的期望值等于该统计量所估计的总体参数,这个估计量叫无偏估计量。 2、样本平均数是总体平均数的无偏估计量 总体变量值有N个( ),样本容量为n个( )。 (1)重复抽样
252
(2)不重复抽样
253
3、样本成数是总体成数的无偏估计量 4、样本方差是总体方差的无偏估计量 (二)有效性:有两个无偏估计量( ),如果那个估计量与总体参数间的平均离差小,这个估计量更有效。 和 都是 的无偏估计量, 与 间的平均离差为 , 与 间的平均离差为 , 所以在估计 (P ) 时, ( p ) 更有效。 (三)一致性:随着样本容量的增大,估计量与被估参数的偏差越来越小。 是 的一致估计量。有限总体时,n最大为N,这时 = ;无限总体时,当n ∞时, 与 间的偏差( )的极限为0。p( )是P( )的一致估计量。
254
二、抽样估计的方法 返回 (一)点估计 (二)区间估计 1、平均数的区间估计 (1)样本取自总体方差已知的正态分布(大、小样本)
255
某制造厂质量管理部门希望估计本厂生产的5500包原材料的平均重量,抽出250包,测得平均重量65千克。总体标准差15千克。总体为正态分布,在置信水平为95%的条件下建立这种原材料的置信区间。
5500包原材料的平均重量在63.14~66.86之间。
256
(2) 正态总体总体方差未知且小样本 因总体方差 未知,只能用 代替, 而n很小 常常与 差异较大, 就不再是一个标准正态分布,而是一个t分布。 例:为了估计一分钟广告的平均费用,抽出15个电视台组成样本,得样本均值10000元,标准差2000元。总体近似服从正态分布,在置信水平为95%的条件下建立广告平均费用的置信区间。 电视台一分钟广告的平均费用在8894~11106之间。
257
(3)正态总体总体方差未知且大样本 总体方差 未知,只能用 来代替,因n很大, 就是 的一个较好的估计量, 仍然是一个近似的标准正态分布。
258
(4)样本取自总体方差已知的非正态分布 某职业介绍所从申请某一职业的1000名申请者中采用不重复抽样方式随机抽取了200名,以此来估计1000名的平均成绩。200名的平均分为78,由以往经验知总体方差90,不知总体服从何种分布。在置信水平为90%的条件下建立1000名申请者平均成绩的置信区间。 1000名申请者平均成绩在77~79之间。
259
(5)样本取自总体方差未知的非正态分布 例:某超市通过100位的样本研究每次购买额,均值和标准差分别为80元和20元,在置信水平为90%的条件下建立100位顾客购买额的置信区间。 所有顾客购买额在76.71和83.29之间。
260
2、成数的区间估计 例1:某企业在一项关于职工流动原因的研究中,从原职工中随机抽取了200人访问,有140人离开的原因是工资太低。以95%的置信水平对总体这种原因离开的人员比例进行区间估计。 该企业由于工资低离开的职工比例为63.6% 与76.4%之间
261
例2 对一批灯泡抽取1%进行质量检验,结果为平均寿命1010小时,抽样平均误差5.6小时;合格率92%,抽样平均误差2.4%。要求在95%的可靠程度下,对该批灯泡的平均寿命和合格率进行区间估计。 据题意 p=92%
262
第九章 综合复习 一、 总论 二、 统计调查 三、 统计资料整理 四、 综合指标 五、 动态数列分析 六、 指数 七、 相关与回归分析
第九章 综合复习 一、 总论 二、 统计调查 三、 统计资料整理 四、 综合指标 五、 动态数列分析 六、 指数 七、 相关与回归分析 八、 抽样推断 返回
263
一、 总论 (一)统计学基本问题 1、统计学的涵义 2、统计学的研究对象和性质 (二)统计学中的几个基本概念
264
二、统计调查 (一)统计调查的组织方式 1、普查 2、重点调查与典型调查的适用条件 (二)统计调查方案 1、调查对象、调查单位 2、调查时间
265
三、统计资料的整理 (一)统计分组 1、单项式分组 2、组距式分组 3、组距式分组中的有关问题 (二)次数分布的编制
(三)统计表的结构和种类
266
四、综合指标 (一)总量指标 时期指标、时点指标的概念及特点 (二)相对指标 1、结构、比例、比较、动态相对指标的涵义
2、强度相对指标的涵义及与平均指标的区别 3、计划任务数为相对数的计划完成相对指标的计算 (三)平均指标 1、加权算术、加权调和、几何平均数的计算及适用条件。 2、各种平均数的优缺点 (四)变异指标 标准差、标准差系数的作用、计算、适用条件。
267
五、动态数列分析 (一)动态分析指标 1、增长量的计算及种类、增长1%的绝对值的计算 2、发展速度的计算、种类及与增长速度的关系
3、用几何平均法计算的平均发展速度和平均增长速度 4、根据时点数列和相对数数列计算的平均发展水平 (二)动态趋势分析 1、动态数列发展变化的四种趋势 2、了解测定长期趋势的方法 3、了解测定季节变动的方法
268
六、指数 (一)综合指数的计算及两因素综合指数体系的因素分析 (二)平均式指数的计算及因素分析 (三)平均指标指数的计算及因素分析
269
七、相关与回归分析 (一)相关与回归分析的主要内容 (二) 相关系数的计算及性质 (三)相关分析与回归分析的关系 (四)回归方程的建立
(二) 相关系数的计算及性质 (三)相关分析与回归分析的关系 (四)回归方程的建立 (五)b与r的关系 (六)估计标准误差的计算及与r的关系
270
八、抽样推断 (一)抽样误差 1、概念 2、简单随机抽样下抽样平均误差的计算 3、抽样平均误差与极限误差的关系 4、影响抽样平均误差的因素
(二)抽样单位数目的确定 1、简单随机抽样下抽样单位数目的计算 2、影响抽样单位数目的因素 (三)抽样估计 1、估计量的优良标准 2、区间估计 返回
271
第十章 复习题 一、填空题 1、“统计”一词的有三个涵义是__________、__________、__________。
第十章 综合复习 2、调查表有二种形式,一种是__________、另一种是__________。 3、结构影响指数X固定构成指数=______________________________。 4、某厂有男职工30人,女职工20人,据此两个组的频率分别是__________和__________。 5、定基发展速度等于相应的__________发展速度之积。 6、分配数列有__________和__________数列。
272
二、单项选择题。(每小题2分,共30分) 1、用是非标志计算平均数,其计算结果为( ) A、P+q; B、P; C、P-q; D、1-P 2、要了解某班40名学生的学习成绩情况,则总体单位( ) A、40个学生 B、每个学生 C、40个学生的学习成绩 D、每一个学生的学习成绩 3、下面哪一个品质标志( ) A、所有制 B、收入水平 C、考试分数 D、年龄 4、比较各种平均数可知,不受极端值影响的是( ) A、算术平均数和几何平均数 B、调和平均数和几何平均数 C、几何平均数和中位数 D、中位数和众数 5、下列指标中的比例的相对指标是( ) A、成人识字率 B、人口性别比率 C、积累率 D、中位数和众数 6、对某班学生按年龄分成16—18岁、19—20岁、21—23岁三组,则23岁是( ) A、上限 B、下限 C、第三组上限 D、第三组下限
273
7、说明样本代表性的误差是( ) A、极限误差 B、抽样平均误差 C、调查登记误差 D、样本标准差 8、一个组的上限与下限之差称为( ) A、组中值 B、组数 C、全距 D、组距 9、对某校学生先按年级分组,在此基础上再按年龄分组,这种分组方法是( ) A、简单分组 B、平行分组 C、复合分组 D、再分组 10、组距数例的全距等于( ) A、最大组的上限与最小组的上限之差 B、最大组的下限与最小组的下限之差 C、最大组的下限与最小组的上限之差 D、最大组的上限与最小组的下限之差 11、1、“统计”一词的基本涵义是( ) A、统计调查,统计整理,统计分析 B、统计设计,统计分组,统计计算 C、统计方法,统计分析,统计预测 D、统计科学,统计工作,统计资料
274
12、单项式变量数列的“单项”意指( ) A、只有一个组 B、每组只有一个变量值 C、每组只有一个单位 D、以上都不对 13、下列变量中属于连续变量的是( ) A、企业的总产值 B、企业个数 C、职工人数 D、企业设备数 14、对某省饮食业从业人员的健康状况进行调查,调查对象是该省饮食业的( ) A、全部网点 B、每一个网点 C、全部从业人员 D、每一个从业人员 15、已知某市的甲、乙、丙三个农贸市场的某一种蔬菜的单价和相等的购买额,计算这种蔬菜的平均价格采用( ) A、算术平均数 B、加权算术平均数 C、简单调查和平均数 D、加权调和平均数
275
三、判断题(正确的打“√”,错误的打“×”)
1、指标和标志是两个根本不同的概念,两者没有任何联系。( ) 2、从形式上看,统计表主要由总标题、横行标题、纵栏标题和指标数值四部分构成。 ( ) 3、变量数列中,缺上限的最大组的组中值计算公式为:缺上限的最大组的组中值=下限+相邻组的组距÷2。 ( ) 4、时期指标与时期长短成正比,时点指标与时点间隔成正比。( ) 5、所有变量值与平均数的离差之和为最大。 ( ) 6、某市对占该市钢铁产量三分之二的5个钢铁企业进行调查,以了解该市钢铁生产的基本情况,这种调查方式属于典型调查。( ) 7、2014年我国人口出生数是一个时点指标。( ) 8、2014年我国人均粮食产量是一个平均指标。( ) 9、连续型变量只能用组距式分组。( ) 10、当两个数列的平均水平相等时,可以用标准差对比其平均水平的代表性。( )
276
四、计算题 1、某地区抽样调查职工家庭收入资料如下: 求(1)算术平均数(平均数) (2)标准差及标准差系数 按平均每人月收入分组(元)
职工户数 100~200 6 200~300 10 300~400 30 400~500 240 500~600 60 600~700 20 求(1)算术平均数(平均数) (2)标准差及标准差系数
277
(4)分析全厂产品价值的变动,如何受到产量和出厂价格等变化的影响。
2、已知某企业产品产量及出厂价格资料 产品名称 单位 出产量 出厂价格(元) 基期 报告期 甲 件 80 100 9 8 乙 个 38 50 5 4 丙 斤 150 230 6 要求:(1)计算产量综合指数。 (2)计算价格综合指数。 (3)计算产品价值总指数。 (4)分析全厂产品价值的变动,如何受到产量和出厂价格等变化的影响。
278
3、某工厂1994年的工业总产值为40. 25万元,2000年由于生产的发展,工业总产值达到65
3、某工厂1994年的工业总产值为40.25万元,2000年由于生产的发展,工业总产值达到65.71万元,试计算1994~2000年间工业总产值的每年平均发展速度和平均增长速度。
279
4、某商店去年进行了4次清库盘点,经核定滞销商品库存额资料如下:
时间 1月初 6月末 11月初 12月末 商品库存额(万元) 15.8 17.2 8.4 4.6 要求:计算全年滞销商品平均库存额。
280
五、问答题 1.标志和指标有何区别、联系? 2.常用的相对指标有哪些? 3.统计分组的作用有哪些?
Similar presentations