Presentation is loading. Please wait.

Presentation is loading. Please wait.

统计学原理 雷州市 广播电视大学 教师进修学校 陈宏渊.

Similar presentations


Presentation on theme: "统计学原理 雷州市 广播电视大学 教师进修学校 陈宏渊."— Presentation transcript:

1 统计学原理 雷州市 广播电视大学 教师进修学校 陈宏渊

2 (2)网上资源,内容有本课程的教学大纲、实施方案,各章的重难点辅导、综合练习及作业、视频课件材料等。
统计学原理的教学资源主要有: (1)文字教材(主、辅) (2)网上资源,内容有本课程的教学大纲、实施方案,各章的重难点辅导、综合练习及作业、视频课件材料等。 网址: (3)本课的考核的依据是考核说明及题库

3 统 计 学 原 理 第二章 统计调查 第一章 统计总论 第三章 统计整理 第四章 综合指标 第五章 抽样估计 第六章 假设检验
统 计 学 原 理 第二章 统计调查 第一章 统计总论 第三章 统计整理 第四章 综合指标 第五章 抽样估计 第六章 假设检验 第七章 相关分析 第八章 指数分析 第九章 动态数列分析 第十章 统计综合分析与评价

4 第一章 统 计 总 论        学 习 目 的  本章对统计学的基本问题进行了介绍,如统计学的研究对象、统计学的研究方法、统计工作过程、统计的职能、统计组织以及统计学的一些基本概念等等。本章的学习目的是,通过学习对统计学科的性质有一个基本的认识。重点是要掌握统计学的基本范畴。

5 在学习过程中主要解决以下几个问题 统计一词的三种涵义及相互关系 统计学的研究对象及其特点 统计学的研究方法 统计学的几个基本概念
第一章 统计总论 在学习过程中主要解决以下几个问题 统计一词的三种涵义及相互关系 统计学的研究对象及其特点 统计学的研究方法 统计学的几个基本概念 统计的职能和组织 练习

6 统计一词的三种含义 统计实践活动,它是对社会自然现象客观存在的 统计工作 现实数量方面进行搜集、整理和分析的活动过程。
第一章 统计总论 统计一词的三种含义 统计实践活动,它是对社会自然现象客观存在的 现实数量方面进行搜集、整理和分析的活动过程。 统计工作 例如:要了解我国人口情况,统计部门要完成下列工作: 设计调查项目——编制调查表——派调查人员逐户调查 ——对调查结果进行整理、分析——最后得出反映我国人 口基本情况的各种统计指标。 它是统计实践活动过程中所取得的各项数字资料 以及与之相关的其它实际资料的总称。 统计资料 各商业企业某月销售额资料 (单位:万元) 10,60,40,80,130,70 50,98,200…… 1998年北京市国民总 收入 亿元人民币, 比1997年增长9.8%。

7 统计学 解决一切 问题所用的 方法均由统 计学提供 三 种 涵 义 的 关 系
第一章 统计总论 统计学是关于认识客观现象总体数量特征和数量 关系的科学 统计学 哪些是我们所需的资料? 应当怎样搜集所需的资料? 解决一切 问题所用的 方法均由统 计学提供 对搜集到的数字资料应 当进行怎样整理才能反 映资料的真实分布特征? 用什么样的方法对数字资 料进行深入分析才能反映 现象发展变化的规律性? 三 种 涵 义 的 关 系 统计工作与统计资料是统计实践活动与统计成果的关系 统计工作与统计学是统计实践活动与统计理论的关系

8 下面我们来分析一下日常生活中人们常提到的“统计”一词的含义。
“据统计”…… 指的是统计资料 “我是搞统计的” 指的是统计工作 指的是统计学原理 “我学过统计”

9 社会经济统计学的研究对象就是社会经济 现象的数量方面,包括数量特征和数量关系 统计学的 研究对象 例如:对我国人口状况进行研究
第一章 统计总论 社会经济统计学的研究对象就是社会经济 现象的数量方面,包括数量特征和数量关系 统计学的 研究对象 例如:对我国人口状况进行研究 人口规模有多大? 人口构成情况怎么样? 劳动力的就业情况怎么样? 人口数量有何变化? 人口的平均寿命有何变化?… 人民的生活状况如何? 统计学研究 对象的特点 数量性 是统计学研究对象最基本的特点 统计是以客观的、具体的、准确的数字来描述和 认识客观现象的特征、性质和规律的,没有数量也 就没有统计;数量分析是认识现象的重要方法;数 学方法是统计学研究的基础。 总体性 社会经济统计是以社会经济现象的总体数量特征作为 自己的研究对象 变异性 社会经济统计研究的总体的数量特征不是一成不变的 构成总体的总体单位的各种特征其表现是不相同的

10 第二节 统计学原理的研究方法 一、统计学的学科性质 二、理论统计学与应用统计学(P6-7) 三、描述统计学与推断统计学(P7-8)
第一章 统计总论 第二节 统计学原理的研究方法 一、统计学的学科性质 二、理论统计学与应用统计学(P6-7) 统计学是研究如何搜集数据、整理数据、分析数据、以便从中作出具有一定可靠度的推断的认识方法论科学 三、描述统计学与推断统计学(P7-8) ~是把研究对象一般化、抽象化,以概率论为基础,从纯理论的角度,对统计方法加以推导论证。其中心内容是统计推断问题,实质是以归纳方法研究随机变量的一般规律。如:统计分布理论,统计估计与假设检验理论,相关与回归分析,方差分析,时间序列分析随机过程理论等。 ~是从所研究领域或专门问题出发,视研究对象的性质采用适当的指标体系和统计方法,以解决所需的问题。它是以问题为中心的,而理论统计学则是以方法为中心的。 四、统计活动的过程(P8) 描述统计学致力于……(P7) 推断统计学致力于…… 统计设计——统计资料搜集——统计资料整理——统计资料分析——统计资料提供和管理

11 五、统 计 学 的 研 究 方 法 (P8-10) 大量观察法 统计分组法 综合指标法 统计模型法 归纳推断法
第一章 统计总论 五、统 计 学 的 研 究 方 法 (P8-10) 大量观察法 统计分组法 综合指标法 统计模型法 归纳推断法 综合指标法是指运用各种统计综合指标来反映和研 究社会经济现象总体的一般数量特征和数量关系的 研究方法。 在统计分析中广泛运用着各种综合指标来反映总体 内部的各种数量关系。如动态分析、因素分析、回 归与相关分析等。 归纳是一种从个别到一般,从事实到概括的一种推理方法, 推断是通过对样本数据的观察,推断出总体的数量特征的 研究方法。 从某种意义上说,统计工作搜集的资料都是样本资料,样 本资料分散、零碎,必须经过整理归纳才能据此推断总体 的数量特征。所以归纳推断法在统计分析中得到广泛应用。 统计模型法指根据一定的经济理论和假定条件,用数 学方程去模拟现实经济现象相互关系的一种研究方法。 统计模型包括三个基本要素: 社会经济变量、基本关系式、模型参数 统计分组法指根据事物的内在性质和统计研究任务的 要求,将总体单位按照某种标志划分为若干组成部分 的研究方法。 例如:人口按年龄分组、企业按经济类型分类、国民 经济按部门分类等。 大量观察法指统计研究社会经济现象和过程, 要从总体上加以考察,就总体中的全部或足 够多的单位进行调查观察并加以综合研究。

12 统计总体与总体单位 样 本(P12) 单位标志与标志表现 变 异 与 变 量 统计指标与指标体系
第一章 统计总论 根据总体包括的总体单位是否有限,统 计总体可以分为无限总体和有限总体。 无限总体:总体中包括的单位无限多, 数不清。 有限总体:总体中包括的单位有限多。 可以数清。 注意:总体与总体单位不是固定不变的, 总体的范围可大可小,要根据研究目的 确定总体的范围,当总体确定了则相应 的总体单位也就确定了。 统计总体:是根据一定的目的和要求所确定的研究 事物的全体,它是由客观存在的、具有 某种共同性质的许多个体构成的整体。 总体单位:是构成总体的个别事物。总体单位可以 是人、物,也可以是企业机构、地域或 状态、长度、时间等等。 例如:①了解城镇居民生活状况,城镇全部居民就构成统计总体,城镇每一位居民就是总体单位。  ②了解工业企业经营情况,全部工业企业就构成统计总体,每一个工业企业就是总体单位。 统计总体与总体单位 样 本(P12) 标志 品质标志:表明单位属性方面的特征。 其表现只能是文字。 数量标志:表明单位数量方面的特征, 其表现是数值,称为标志 值。 例如:职业是品质标志,标志表现具体为工人、 公务员、商业职工、教师等。 年龄是数量标志,标志表现具体为10岁、 20岁、30岁等。 单位标志:简称标志,指总体中所共同 具有的属性和特征。 标志表现:标志的具体表现形式。 单位标志与标志表现 变量 连续变量:其取值是连续不断的,不能 以整数断开。如身高、体重、 产值等变量。 离散变量:其数值可以按一定顺序一一 列举出来,通常取整数形式。 如人数、企业数、机器台数 等变量。 变异:就是差异,指某个标志在总体 各单位表现的不同。 变量:一般把可变的数量标志称为变量。 变 异 与 变 量 统计指 标特点 具体性:经济理论规定了指标的内涵, 是客观现象量的具体反映。 可量性:统计指标均可用数值表现, 不存在不能用数值表示的统 计指标。 综合性:统计指标既是同质总体大量 个别单位的总计,又是个别 单位标志值的差异综合。 统计指标体系:是各种相互联系的指标构成的 整体,用以说明所研究现象各方面相互依存和 相互制约的关系。 统计指标与指标体系 指标 种类 数量指标:反映总体现象的总规模、工作 总量。如总人口、企业总数等。 质量指标:反映总体现象的相对水平,或 工作质量。如平均工资、 人 口密度、出生率等。 统计指标:反映实际存在的社会经济总体某 一综 合数量特征的社会经济范畴。 如工业总产值、商品销售额等。 统计指标与统计标志有何区别与联系?

13 第一章 统计总论 统 计 的 职 能 国家统计系统是社会经济统计的主体,是国家管理系统的重要组成部分。现代国家管理系统包括决策系统、执行系统、信息系统、咨询系统和监督系统,国家统计则兼有其中的信息、咨询、监督三种系统的职能。 统 计 的 组 织 综合统计系统 专业统计系统 基层单位的统计组织 专业统计 国务院各业务部门统计机构 系统构成 地方各级业务部门统计组织 综合统计 国家统计局 系统构成 地方各级统计机构 基层单位 企事业单位统计组织 统计组织 乡镇统计组织

14 一、判 断 对 错 1、社会经济统计的研究对象是社会经济现象总体的各个方面。 ( ) √
第一章 统计总论 一、判 断 对 错 1、社会经济统计的研究对象是社会经济现象总体的各个方面。                    ( ) 2、统计调查过程中采用的大量观察法,是指必须对研究对象 的所有单位进行调查。( ) × 3、社会经济统计学的研究对象是社会经济现象的数量方面, 但它在具体研究时也离不开对现象质的认识。( ) 4、总体的同质性是指总体中的各个单位在所有标志上都相同。                    ( ) × 5、品质标志表明单位属性方面的特征,其标志表现只能用 文字表现,所以品质标志不能直接转化为统计指标。( ) 6、品质标志说明总体单位的属性特征,质量指标反映现象 的相对水平或工作质量,二者都不能用数值表示。( ) ×

15 二、单 项 选 择 题 1、构成统计总体的个别事物称为 ( )。 A、调查单位 B、标志值 C、品质标志 D、总体单位 D
第一章 统计总论 二、单 项 选 择 题 1、构成统计总体的个别事物称为 ( )。 A、调查单位 B、标志值 C、品质标志 D、总体单位 D 2、对某城市工业企业未安装设备进行普查,总体单位是( ) A、工业企业全部未安装设备 B、工业企业每一台未安装设备 C、每个工业企业的未安装设备 D、每一个工业企业 B 3、几位学生的某门课成绩分别是67分、78分、88分、89分、 96分,“学生成绩”是( )。 A、品质标志 B、数量标志 C、标志值 D、数量指标 B 4、统计指标按所反映的数量特点不同可以分为数量指标和质量 指标两种。其中数量指标的表现形式是( )。 A、绝对数 B、相对数 C、平均数 D、百分数 A 5、在全国人口普查中( )。 A、男性是品质标志 B、人的年龄是变量 C、人口的平均寿命是数量标志 D、全国人口是统计指标 B

16 三、多项选择题部分 1、要了解某地区的就业情况( ) A、全部成年人是研究的总体 B、成年人口总数是统计指标
第一章 统计总论 三、多项选择题部分 1、要了解某地区的就业情况( ) A、全部成年人是研究的总体 B、成年人口总数是统计指标 C、成年人口就业率是统计标志 D、某人职业是教师是标志表现 E、反映每个人特征的职业是数量指标 A B D 2、下列各项中,属于统计指标的有( ) A、1999年全国人均国内生产总值 B、某台机床使用年限 C、某市年供水量 D、某地区原煤生产量 E、某学员平均成绩 A C D 3、在工业普查中( ) A、工业企业总数是统计总体 B、每一个工业企业是总体单位 C、固定资产总额是统计指标 D、机器台数是连续变量 E、职工人数是离散变量 B C E

17 单元辅导课共有8节,主要内容是对每章中的重、难点问题进行辅导,并结合同学们学习的进度讲一部分典型例题,从题意的理解到做题的步骤及如何进行分析,帮助同学们掌握类似的题目的解题思路、步骤、技巧和应用数据进行分析的能力。

18 第一单元 (一、二) 第一章总论 第二章 统计调查 第三章 统计整理 第二单元 第四章 综合指标 第三单元(一、二) 第五章 抽样调查 第七章 相关分析 第四单元(一、二) 第八章 指数分析 第九章 动态分析 期末总复习

19 第二章 统 计 调 查 学 习 目 的 统计调查是统计工作过程的第二个阶段,即搜集 统计数据资料的阶段。所搜集的数据资料的质量状况
第二章 统 计 调 查 学 习 目 的 统计调查是统计工作过程的第二个阶段,即搜集 统计数据资料的阶段。所搜集的数据资料的质量状况 直接影响到统计分析的结果,因此,搜集统计资料必 须有一套科学的方式、方法。本章对此问题进行了介 绍。通过本章的学习,要求了解统计调查的意义、种 类,掌握统计调查方案的内容,各种统计调查方式、 方法的应用条件。

20 第二章 统计调查 在学习过程中主要解决以下几个问题 统计调查的基本要求和统计调查的种类 统计调查方案的内容 统计调查方法 统计调查资料的检查

21 统计调查的基本要求 统 计 调 查 的 种 类 及时性 准确性 根据被研究总 体的范围划分 按调查登记的时 间是否连续划分 全面调查
第二章 统计调查 统计调查的基本要求 及时性 准确性 统 计 调 查 的 种 类 根据被研究总 体的范围划分 按调查登记的时 间是否连续划分 全面调查 非全面调查 连续调查 非连续调查 按搜集资料的方法划分 直接调查 凭证调查 派员调查 问卷调查

22 统计调查方案的 内 容 (P32) 统计调查方案是指导统计调查工作的纲领性文件。 调查方案设计的好坏直接影响到调查数据的质量。
第二章 统计调查 统计调查方案是指导统计调查工作的纲领性文件。 调查方案设计的好坏直接影响到调查数据的质量。 不同调查任务的调查方案在具体内容和形式上会 有一定的差别,但包括的主要内容大体是一致的。 调查目的 调查对象 统计调查方案的 内 容 (P32) 调查项目 调查表 调查时间和期限 调查的组织工作

23 调查目的 调查目的是调查所要达到的具体目标 它回答的是:为什么调查?要解决什么样的问题? 调查具有什么样的社会经济意义?
第二章 统计调查 调查目的 调查目的是调查所要达到的具体目标 它回答的是:为什么调查?要解决什么样的问题? 调查具有什么样的社会经济意义? 调查目的的写作应简明扼要。 例如:我国人口普查的目的是“为准确地查清我国在 人口数量、地区分布、构成和素质方面的变化,为 科学地制定国民经济和社会发展战略与规划,统一 安排人民的物质和文化生活,检查人口政策执行情 况,提供可靠的资料”。

24 调查对象和调查单位 调查对象和调查单位所解决的问题是: 调查对象是根据调查目的 确定的调查研究的总体或 调查范围。 调查单位是构成调查对象的
第二章 统计调查 调查对象和调查单位 调查对象是根据调查目的 确定的调查研究的总体或 调查范围。 调查单位是构成调查对象的 每一个单位,是搜集数据资 料的基本单位。 调查对象和调查单位所解决的问题是: ——向谁调查? ——由谁来提供所需资料? 例如:人口普查的调查对象是具有中华人民共和国国籍并 在中华人民共和国境内常住的人。 人口普查的调查单位是每一个人。 注意:调查单位与填报单位的区别。

25 调查项目和调查表 调查项目是调查的具体内容 它可以是调查单位的数量特征,如一个人的年龄、收入,一个企业的职工人数、产值;
第二章 统计调查 调查项目和调查表 调查项目是调查的具体内容 它可以是调查单位的数量特征,如一个人的年龄、收入,一个企业的职工人数、产值; 也可以是调查单位的某种属 性特征,如一个人的性别、职 业,一个企业的经济类型等。 调查表是用于登记调查数据的一种表格,一般由 表头、表体和表外附加三部分组成。 某企业基本情况报表(表头) 制表机关: 调查项目 项目代码 计量单位 实际数值 甲      1      人      乙 台 丙 人 … … …     … 说明:……(表外附加)

26 调查时间和时限 为确保调查资料的准确性,统计调查必须规定这两种时间 调查时间: 调查时限: 是调查资料所属的时间。 即规定所调查的是哪个
第二章 统计调查 调查时间和时限 为确保调查资料的准确性,统计调查必须规定这两种时间 调查时间: 调查时限: 是调查资料所属的时间。 即规定所调查的是哪个 时期或时点的资料。 是进行调查工作的期限。 即从调查工作开始到结 束的时间长度。 例如:第四次人口普查规定的标准时间是“1990年 7月1日0时”,并要求在“1990年7月1日至10日 完成普查的登记工作”。 1990年7月1日0时就是调查时间, 1990年7月1日至10日就是调查时限。 这项内容包括的比较多,如调查机构的确定, 调查人员的选择、培训,调查经费的来源和支 出预算,以及其它一些调查工作的准备等。 调查的组织 工 作

27 统计调查方法 普 查 普查 抽样调查 统计报表 重点调查 典型调查 涵义:普查是专门组织的,一般用来调查属于一定
第二章 统计调查 统计调查方法 普查 抽样调查 统计报表 重点调查 典型调查 涵义:普查是专门组织的,一般用来调查属于一定 时点上社会经济现象数量的全面调查。 P36 普查是专门调查 特点 普查是全面调查 普查是一种不连续调查 普查通常是一次 性的或周期性的 普查必须规定 标准调查时间 作用:普查主要用来搜集那些反映国 情国力方面的基本统计资料。 例如:人口普查、工业普查、物资库存普查、 乡镇企业普查、商业饮食业普查等等。

28 抽 样 调 查(P37) 抽样调查是一种非全面调查,它是按照随机原则从 总体中抽取部分单位进行观察,用以推断总体数量 特征的一种调查方式。
第二章 统计调查 抽 样 调 查(P37) 抽样调查是一种非全面调查,它是按照随机原则从 总体中抽取部分单位进行观察,用以推断总体数量 特征的一种调查方式。 是一种非全面调查,但是又要 达到对总体数量特征的认识。 按照随机原则抽选调查单位。 经济性、时效性、 准确性、灵活性 能够解决全面调查无法或难以解决的问题。 可以补充和订正全面调查的结果。 可以用于对总体的某种假设进行检验。 简单随机抽样 类型随机抽样 等距随机抽样 整群随机抽样 先将总体各单位划分为许多群,再 以群为单位,从中随机抽选部分群 ,对中选群的所有单位进行调查。 先对总体各单位按主要标志进行分 类,再按随机原则抽选调查单位。 对总体不进行任何整理,直接从总 体中按照随机原则抽选调查单位。 将总体各单位按某一标志大 小顺序排列,然后依一定间 隔抽取样本单位进行调查。

29 统 计 报 表(P39) 重点调查与典型调查(P41) 什么是统计报表? 基本特点是什么? 有何作用? 有哪几种类型? 二者共同点
第二章 统计调查 统 计 报 表(P39) 什么是统计报表? 基本特点是什么? 有何作用? 有哪几种类型? 重点调查与典型调查(P41) 二者共同点 都属于非全面调查 重点调查的目的是反映总体的基本情况 调查目的不同 二者区别 典型调查的目的是推算总体的数量特征 选择调查单位的方法不同 重点调查 典型调查 根据客观标准 选择重点单位 在对现象分析的基础上 有意识地选择典型单位

30 调查资料的检查(P44) 准确性检查就是对调查误差的检查 准确性 完整性 及时性 登记性误差 代表性误差 由于错误判断事实 或错误登记事实而
第二章 统计调查 调查资料的检查(P44) 准确性 完整性 及时性 准确性检查就是对调查误差的检查 登记性误差 代表性误差 由于错误判断事实 或错误登记事实而 发生的误差。 这种误差可以避免 根据样本单位的数量 特征推断总体数量特 征时产生的误差。 这种误差不可避免 登记性误差:逻辑检查、计算检查 检查方法 代表性误差:可计算出误差,并通过调整 一些条件控制误差的大小。

31

32 一、判 断 对 错 1、全面调查和非全面调查是根据调查结果所得到的资料是 否全面来划分的。( ) ×
第二章 统计调查 一、判 断 对 错 1、全面调查和非全面调查是根据调查结果所得到的资料是 否全面来划分的。( ) × 2、对某市下岗职工生活状况进行调查,要求在一个月内报 送调查结果。所规定的一个月时间是调查时间。( ) × 3、我国人口普查的总体单位和调查单位都是每一个人,而 填报单位是户。( ) 4、采用重点调查搜集资料时,选择的调查单位是标志值较 大的单位。( ) × 5、统计调查误差就是指由于错误判断事实或者错误登记事 实而发生的误差。( ) × 6、典型调查既可以搜集数字资料,又可以搜集不能用数字 反映的实际情况。( ) 7、重点调查与抽样调查的目的是一致的,即都是通过对部 分单位的调查,来达到对总体数量特征的认识。( ) ×

33 二、单 项 选 择 题 1、连续调查与不连续调查的划分依据是( )。 A、调查的组织形式不同 B、调查登记的时间是否连续
第二章 统计调查 二、单 项 选 择 题 1、连续调查与不连续调查的划分依据是( )。 A、调查的组织形式不同 B、调查登记的时间是否连续 C、调查单位包括的范围是否全面 D、调查资料的来源不同 B 2、对一批商品进行质量检验,最适宜采用的方法是( )。 A、全面调查 B、抽样调查 C、典型调查 D、重点调查 B 3、下列调查中,调查单位与填报单位一致的是( )。 A、企业设备调查 B、人口普查 C、农村耕地调查 D、工业企业现状调查 D 4、抽样调查的主要目的是( )。 A、计算和控制抽样误差 B、推断总体数量特征 C、对调查单位作深入研究 D、广泛运用数学方法 B 5、下述各项调查中属于全面调查的是( )。 A、对某种连续生产的产品质量进行检验 B、某地区对工业企业设备进行普查 C、对全面钢铁生产中的重点单位进行调查 D、抽选部分地块进行农产量调查 B

34 三、多项选择题部分 1、在工业设备普查中( ) B D E 2、制定统计调查方案,应确定( ) A B C E
第二章 统计调查 三、多项选择题部分 1、在工业设备普查中( ) A、工业企业是调查对象 B、每个工业企业是填报单位 C、每台设备是填报单位 D、每台设备是调查单位 E、工业企业的全部设备是调查对象 B D E 2、制定统计调查方案,应确定( ) A、调查目的和调查对象 B、调查单位和填报单位 C、调查项目和调查表 D、调查资料的使用范围 E、调查的时间和时限 A B C E 3、抽样调查和重点调查的共同点是( ) A、两者都是非全面调查 B、两者选取单位都不受主观因素的影响 C、两者都按随机原则选取单位 D、两者都按非随机原则选取单位 E、两者都可以用来推断总体指标 A B 4、调查单位是( ) A、需要调查的总体 B、需要调查的总体单位负责人 C、调查项目的承担者 D、负责报告调查结果的单位 E、调查对象所包含的具体单位 C E

35 第三章 统 计 整 理 学习目的与要求: 1、明确统计整理在统计研究中承前启后的地位 2、掌握分组的方法和汇总技术
第三章 统 计 整 理 学习目的与要求: 1、明确统计整理在统计研究中承前启后的地位 2、掌握分组的方法和汇总技术 3、认识统计分布是统计整理的重要表现形式 4、学会统计表的编制并能熟练运用

36 在学习过程中主要解决以下几个问题 统计整理的意义和方法 统计分组的含义和种类 统计分组的方法 统计分布和分配数列的编制 统计分布的类型
第三章 统计整理 在学习过程中主要解决以下几个问题  统计整理的意义和方法  统计分组的含义和种类  统计分组的方法  统计分布和分配数列的编制 统计分布的类型  统计表的结构和种类

37 第三章 统计整理 一、统计整理的意义和方法 统计调查搜集上来的资料,不论是哪一种类型的资料都必须经过整理才能进一步进行分析。资料的类型不同,研究的目的不同,资料整理的方法也不同。 统计整理是根据统计研究任务的要求,对调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化的工作过程。

38 根据某班40名学生统计学考试成绩分析该班学生考试情况。
60分以下为不及格,60~69为及格,70~79为中,80~89为良,90分以上为优。

39 按成绩等级分组 人数(人) 各组人数占 总人数比重(%) 不及格 及 格 合 计

40 将这些数据资料按“销售额”的多少进行整理,得到下列整理结果:
第三章 统计整理 再如:通过调查取得100个商业企业某月销售额资料:(单位:万元) 20,60,45,90,105,56,250,89,130,30,98,…300。 将这些数据资料按“销售额”的多少进行整理,得到下列整理结果:

41 统计整理的方法:分组、汇总、编表 销售额(万元) 企业数(个) 0 — 50 12 50 — 100 25 100— 150 30
第三章 统计整理 销售额(万元) 企业数(个) 0 — 50 — 100— 150— 250— 合 计 统计整理的方法:分组、汇总、编表

42 二、 统计分组的含义和种类 统计分组: 根据研究任务的要求和现象总体的内在特点, 把统计总体按照某一标志划分为若干性质不
第三章 统计整理 二、 统计分组的含义和种类 统计分组: 根据研究任务的要求和现象总体的内在特点, 把统计总体按照某一标志划分为若干性质不 同又有联系的几个部分。 统计分组应 达到的要求 同一组内的单位性质相同,不 同组所包括的单位性质相异。 例如: 工业企业按经济类型分组,可分为以下几组: 经济类型 企业数(个) 国有企业 合资企业 合作经营企业 股份制企业 工业企业按职工人数分组,可分为以下几组: 职工人数 企业数(个) 500人以下 500— 1000— 工业企业按地区分组,可分为以下几组: 地区 企业数(个) 北京市 天津市 上海市

43 分组标志的选择 选择分组标志的一般原则 选择什么样的分组标志,就会形成什么样的分组结果, 因此,分组标志的选择是统计分组的关键。
必须根据统计研究的目的,在对现象进行分析的基础上 ,抓住具有本质性的区别及反映现象内在联系的标志来 作为分组标志。(P54)

44 类型分组 结构分组 分析分组 按研究任务和作用不同 简单分组 复合分组 按分组标志的多少不同 品质分组 变量分组 按分组标志的性质不同

45 三、统计分组方法 品质 分组 方法 按品质标志对资料进行分组。这种分组有些比较简单, 有些非常复杂,复杂的品质分组称为分类。如:人口
第三章 统计整理 三、统计分组方法 品质 分组 方法 按品质标志对资料进行分组。这种分组有些比较简单, 有些非常复杂,复杂的品质分组称为分类。如:人口 按性别分组、按职业分组、企业按经济类型分组、等。 以一个变量值代表一组。如:人口按年龄分 组1岁一组,学生按报考科目分组等。这种 分组适用于离散性变量,且变量值的个数较 少的情况。 单项式 分 组 变量 分组 方法 以变量值变动的一个区间作为一组,区间的 距离称为组距。适用于连续型变量和离散型 变量的变量值较多的情况。 组距式 分 组

46 第三章 统计整理 在进行组距分组时,会涉及到一些 问题,包括:等距分组和不等距分 组、组限、组中值。

47 以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。
第三章 统计整理 各组组距均相等。如: 10—20 20—30 30—40 以上各组组距均为10。 这种分组适用于均匀分布的总体。 等 距 分 组 不等距 分 组 各组组距不一定相等。如: 10—20 20—50 50—60 60—70 以上分组中,其中第二组与其它各组的组距不同。这种分组适用于资料分布离差较大或者是为了满足特殊的研究目的的需要。

48 组限 组限就是每一组两端的数值。 10 — 20 20 — 30 30 — 40 下限 上限
确定组限的方法有两种:间断式确定组限和重叠式确定组限。 职工人数(人) 99以下 100—199 200—299 300—399 固定资产额(万元) 50—60 60—70 70—80 80—90 间断式确定组限 适用于离散变量 重叠式确定组限 适用于连续变量

49 组中值 每组上限与下限之间的中点数值,是各组的假定平均数。 组中值 = (上限值+下限值)÷2 开口组组中值的计算:
第三章 统计整理 每组上限与下限之间的中点数值,是各组的假定平均数。 组中值 组中值 = (上限值+下限值)÷2 开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2 缺上限:组中值=本组下限+ 相邻组组距/2 例如 产值(万元) 第一组组中值: 50以下 50 — 60 60 — 70 70以上 50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75

50 四、统计分布和分配数列的编制 (一)统 计 分 布 总体所分的各个组和各组所拥有的单位数(次数或频数)。
第三章 统计整理 四、统计分布和分配数列的编制 (一)统 计 分 布 统计分布又称分配数列。它是把总体的所有单位按组归并排列后形成总体中各个单位在各组间的分布。它由两部分组成: 总体所分的各个组和各组所拥有的单位数(次数或频数)。

51 频率:各组的频率大于0,各组的频率总和等于1或100%。
第三章 统计整理 工资分组 职工人数(人) 各组人数所占比重 (元) (次数或频数) (%) (频率) 500— 600— 700— 合 计 频率:各组的频率大于0,各组的频率总和等于1或100%。

52 (二)分配数列的种类 分配数列是在分组的基础上形成的,根据分组时采用的分 组标志不同,分配数列可分为: (这种数列一般比较稳定,只要分组
第三章 统计整理 (二)分配数列的种类 分配数列是在分组的基础上形成的,根据分组时采用的分 组标志不同,分配数列可分为: (这种数列一般比较稳定,只要分组 标准定的比较恰当,通常能准确地反 映总体的分布特征。) 品质分配数列 分配数列 单项式分配数列 变量分配数列 等距数列 组距分配数列 不等距数列

53 (三)分 配 数 列 的 编 制 1、品质分配数列的编制: 只需将品质标志的表现一一排列出来,然后汇总
第三章 统计整理 (三)分 配 数 列 的 编 制 1、品质分配数列的编制: 只需将品质标志的表现一一排列出来,然后汇总 出每一种标志表现出现的次数即可。如下例: 经济类型 企 业 数 比重(%) 国有企业 股份制企业 合资企业 独资企业 100 80 50 20 40 32 20 8 合 计 250 100

54 2、变量分配数列的编制: 其基本步骤为: 第一步:将原始资料按数值大小依次排列。 第二步:确定变量的类型和分组方法(单
第三章 统计整理 2、变量分配数列的编制: 其基本步骤为: 第一步:将原始资料按数值大小依次排列。 第二步:确定变量的类型和分组方法(单 项式分组或组距分组)。 第三步:确定组数和组距。当组数确定后, 组距可计算得到: 组距 = 全距÷组数 全距 = 最大变量值-最小变量值

55 注意:第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。)
第三章 统计整理 第四步:确定组限。 注意:第一组的下限要小于或等于最小变量值,最后一组的上限要大于最大变量值。) 第五步:汇总出各组的单位数,计算频率,并编制统计表。 注意不同方法确定的组限在汇总单位数时的区别)见教材P59例题3

56 间断式确定组限:汇总各组单位数时,按照“上下限均
包括在本组内”的原则汇总。 重叠式确定组限:汇总各组单位数时,按照“上组限不在 内”的原则汇总。 职工人数(人) 499以下 500 — 599 600 — 699 700 — 799 单位数(个) 产值(万元) 50 — 60 60 — 70 70 — 80 80 — 90 单位数(个) 因为有了“上组限不在内”的原则,实际工作中,对 于离散型变量也经常采用重叠式确定组限的方法。

57 3、累计频数或频率分配数列的编制方法 序 计划完成 工人数 比重 向上累计 向下累计 号 程度(%) (人) (%) 人数 比重 人数 比重
第三章 统计整理 3、累计频数或频率分配数列的编制方法 序 计划完成 工人数 比重 向上累计 向下累计 号 程度(%) (人) (%) 人数 比重 人数 比重 合 计 2 1.0 200 100 7 3.5 198 99.0 21 10.5 193 96.5 52 26.0 179 89.5 117 58.5 148 74.0 169 84.5 83 41.5 192 96.0 31 15.5 200 100 8 4.0 通过累计频数分配数列可以反映累计到某一组出现的总次 数或总频率。想一想:第四组的累计结果说明什么问题?

58 五、 统计分布的类型 钟型分布、U型分布、 J型分布、洛伦茨分布 钟型分布:特征是“两头小,中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少,其形状宛如一口古钟。(见教材P62) 向右偏态 向左偏态

59 U型分布:特征是靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,其形状宛如英文字母U。(见教材P62)

60 J型分布:特征是次数随着变量值的增大而增多或随 变量值的增大而减少,其形状宛如英文大 写字母J。(见教材P63)
洛伦茨分布 洛伦茨分布曲线是专门用以检定社会收入分配的平等程度。P63-65 月收入 金融资产

61 表3-13某城镇居民收入和金融资产分组资料 按月收入分组(元) 户数 月收入(元) 金融资产(万元) (甲) (1) (2) (3)
500以下 500~1000 1000~1500 1500~2500 2500~3500 3500以下 3 6 13 21 15 1466 4125 16556 40278 42724 22945 2.95 8.93 33.43 106.34 155.31 87.20 合计 64 128094 394.16

62 表3-14 某城镇居民收入和金融资产的比重 按月收入分组(元) 户 数 月 收 入 金 融 资 产 比重(%) 比重累计(%) (甲)
表 某城镇居民收入和金融资产的比重 按月收入分组(元) 户 数 月 收 入 金 融 资 产 比重(%) 比重累计(%) (甲) (1) (2) (3) (4) (5) (6) 500以下 500~1000 1000~1500 1500~2500 2500~3500 3500以上 4.7 9.4 20.3 32.8 23.4 14.1 34.4 67.2 90.6 100.0 1.1 3.2 12.9 31.5 33.4 17.9 4.3 17.2 48.7 82.1 0.7 2.3 8.5 27.8 38.6 22.1 3.0 11.5 39.3 77.9 合计

63 表3-15 基尼系数计算表 Pi Ii Si PiIi Pi(1-Si) 某一组的户数占总户数的比重 某一组月收入占全部月收入的比重
表 基尼系数计算表 某一组的户数占总户数的比重 某一组月收入占全部月收入的比重 为I的向上累计 Pi Ii Si PiIi 100-Si Pi(1-Si) ⑷=⑴×⑵ ⑸=100-⑶ ⑹=⑴ × ⑸ A B C D E F 4.7 9.4 20.3 32.8 23.4 0.7 2.3 8.5 27.8 38.6 22.1 3.0 11.5 39.3 77.9 100.0 3.29 21.62 172.55 911.84 903.24 207.74 99.3 97.0 88.5 60.7 466.71 911.80 517.14 基尼系数 G= × =0.36

64 六、统计表的结构和种类 (一)、统计表的结构(P66)
把汇总结果的资料按一定的规则在表格上表现出来,这种表格叫统计表。(广义上,任何用以反映统计资料的表格都是统计表) 统计表和统计图都是系统地表述数字资料的基本形式 统计表的构成:(P66) 1、从外表形式上看:标题、横行、纵栏、数字资料 2、从内容上看:主词(列在表的左方) 宾词(列在表的上方) 主词指总体所分的各个组,宾词用来说明主词的各指标。

65 (二)、统计表的种类(P67) 1、按主次的结构,即主词是否分组和分组的程度,分为简单表、分组表和复合表 简单表是主词未经任何分组的统计表 分组表是主词按某一标志进行分组的统计表,分组表用来揭示现象不同类型的不同特征,研究总体的内部构成,分析现象之间的依存关系。 复合表是主词按两个或两个以上标志进行复合分组的统计表。 (三)、宾词指标的分组配置 1、平行配置:指宾词栏中各分组标志彼此分开,各标志的分组指标做平行排列。 2、层叠配置:指将各分组标志层叠在一起,使各标志的分组指标有较大的增多。

66 (四)、统计表的编制原则(P69) 1、统计表的各种标题,特别是总标题的表达,应该十分简明确切,概括地反映出表的基本内容。 2、表的主词各行和宾词各栏,一般应按先局部后整体的原则排列,即先列各个项目,后列总计。 3、如果统计表的栏数较多,通常要编号 4、表中数字应该填写整齐,对准位数 5、统计表中必须注明数字资料的计量单位 6、必要时,统计表应家注说明或解释

67 例:某企业工人日产量资料如下 日产量分组(件) 工人数 50—60 6 90—100 15 60—70 9 100—110 18 70—80
12 110—120 20 80—90 14 120—130 8 要求:1、指出上述变量数列属于哪一种变量数列?这个数列说明什么问题? 2、指出统计表中的变量、变量值、上限、下限、次数、频率、总体单位总数 3、计算组距和各组组中值

68 一、判 断 对 错 1、对统计资料进行分组的目的就是为了区分各组单位之间质 的不同。( ) ×
第三章 统计整理 一、判 断 对 错 1、对统计资料进行分组的目的就是为了区分各组单位之间质 的不同。( ) × 2、组中值是根据各组上限和下限计算的平均值,所以它代表 了各组的平均分配次数。( ) × 3、分配数列的实质是把总体单位总量按照总体所分的组进行 分配。( ) 4、某企业职工按文化程度分组形成的分配数列是一个单项式 分配数列。( ) × 5、对资料进行组距式分组,是假定变量值在各组内部的分布 是均匀的,所以这种分组会使资料的真实性受到损害。( ) 6、任何一个分布都必须满足:各组的频率大于0,各组的频数 总和等于1或100%( ) × 7、统计分组后掩盖了各组内部各单位的差异,而突出了各组 之间单位的差异。( )

69 二、单 项 选 择 题 1、统计整理的关键是( ) A、对调查资料进行审核 B、对调查资料进行统计分组
第三章 统计整理 二、单 项 选 择 题 1、统计整理的关键是( ) A、对调查资料进行审核 B、对调查资料进行统计分组 C、对调查资料进行汇总 D、编制统计表 B 2、下列分组中属于按品质标志分组的是( ) A、学生按考试分数分组 B、产品按品种分组 C、企业按计划完成程度分组 D、家庭按年收入分组 B 3、有一个学生考试成绩为80分,在统计分组中,这个变量值 应归到( )组。 A、60—70分 B、70—80分 C、80—90分 D、90—100分 C 4、某主管局将下属企业先按轻、重工业分组,再按规模分组, 这种分组属于( )分组。 A、简单分组 B、复合分组 C、分析分组 D、结构分组 B

70 三、多项选择题部分 1、下列数列属于( ) 按生产计划完成程度分组(%) 企业数 80─90 15 90─100 30 100─110 5
第三章 统计整理 三、多项选择题部分 1、下列数列属于( ) 按生产计划完成程度分组(%) 企业数 80─ 90─ 100─ 合 计 B C D E A、品质分配数列 B、变量分配数列 C、组距式变量分配数列 D、等距变量分配数列 E、次数分配数列 2、在次数分配数列中( ) A、总次数一定,频数和频率成反比 B、各组的频数之和等于100 C、各组频率大于零,频率之和等于1 D、频率越小,则组的标志值所起的作用越小 E、频率表明各组标志值对总体的相对作用程度 C D E


Download ppt "统计学原理 雷州市 广播电视大学 教师进修学校 陈宏渊."

Similar presentations


Ads by Google