Presentation is loading. Please wait.

Presentation is loading. Please wait.

第二章 统计数据的搜集、整理与显示 第一节 统计数据的搜集 第二节 统计数据的整理 第三节 统计数据的显示.

Similar presentations


Presentation on theme: "第二章 统计数据的搜集、整理与显示 第一节 统计数据的搜集 第二节 统计数据的整理 第三节 统计数据的显示."— Presentation transcript:

1 第二章 统计数据的搜集、整理与显示 第一节 统计数据的搜集 第二节 统计数据的整理 第三节 统计数据的显示

2 第一节 统计数据的搜集 一、统计数据的搜集方法 1. 统计数据搜集的概念
第一节 统计数据的搜集 一、统计数据的搜集方法 1. 统计数据搜集的概念 根据统计研究预定的目的和任务,运用科学的方法与手段,有计划、有组织地向客观实际采集数据的过程 从统计工作过程的阶段性看,统计数据的搜集处于统计工作过程的基础阶段。 2. 统计数据搜集的方式 一种是直接向调查对象搜集反映调查单位的统计数据(或称原始资料);另一种是搜集已经加工、整理过的、说明总体现象的数据(一般称为二手资料)。 3. 统计数据的分类 按其性质不同分为调查数据和试验数据 4. 统计数据的搜集方法 对于调查数据的搜集,通常称为统计调查。搜集的是调查对象的原始资料,常用的方法有直接观察法、报告法(通讯法)、采访法、实验调查设计等。

3 统计调查 案例1: 上世纪八十年代,美国著名的科达公司为了改善其平稳的销售状况,进行了一项市场调查,通过调查发现,业余的摄影爱好者,由于不熟悉摄影技术,大约每年要损坏20亿张底片,这一调查研究导致了科研人员研究开发新的产品,从而一种 Kodac disc 相机问世,这种相机大大减少了焦距不准和暴光不足的问题,该产品1982年投产以后成为科达公司历史上最成功的新产品之一。

4 案例二: 上世纪五、六十年代美国盖洛普公司曾经作过一项美国汽车需求情况的调查,发现很多家庭希望小型省油的汽车,但当时并没有引起美国汽车制造商的重视,仍把研发重点放在生产豪华的车型,结果到了七、八十年代,在世界汽车市场中,日本的中小型汽车获得了很大的份额,连美国本国也大量进口日本汽车,这才引起美国的重视。而汽车的研发到投产需要一个较长的时间,使美国的汽车业失去了一个很好的机遇。这个例子从反面说明了调查信息的重要性。

5 调查的组织形式 普查 抽样调查 重点调查 典型调查 报表制度 调查者 调查对象

6 统计调查的种类 全面调查 按调查单位的范围大小分为 非全面调查 经常性调查 按调查登记时间是否连续分为 一次性调查 按调查的组织方式不同分为
普查 抽样调查 典型调查 重点调查 统计报表 专门调查 直接观察法 问卷调查法 按资料收集方式分 报告法 卫星遥感法 采访法

7 全面调查 全面调查是对调查对象的全部单位一一加以调查。如普查和全面统计报表。 例如
人口普查要调查登记全国每个人的状况,工业定期报表要求全国每个工业企业定期向指定机关上报. 例如 全面调查涉及面广,调查单位多;要耗费较多的人力、物力、财力,调查的时间也较长。

8 非全面调查 对调查对象中的一部分单位进行调查,通过这些部分单位的调查来了解全面 或一定范围(如某种类型)的情况 。 例如
对调查对象中的一部分单位进行调查,通过这些部分单位的调查来了解全面 或一定范围(如某种类型)的情况 。 职工家庭收支情况调查,采取抽取其中一部分职工家庭,比较细致地进行调查;对有破坏性产品的质量检查,如炮弹质量、火柴质量的好坏等,不可能进行全面调查,只得采用非全面调查. 例如 调查单位少,可以节省人力、物力和财力。

9 经常性调查 一次性调查 指随着被研究现象的变化,连续不断地进行登记。以反映现象在一段时间内的全部发展过程。如工业产品产量、商品销售量等。
对时点现象进行定期或不定期的调查登记,以反映现象在某一时点上的发展水平或规模。如人口数及其构成、物资库存情况等. 一次性调查

10 按照统一的表式要求,自上而下地统一布置,自下而上地统一提供统计数据的调查方式。如为进行业务指导需要而颁发的工农业生产等业务统计报表等.
专门调查是为了研究某些专门问题或为某一目的而对某些社会经济现象专门组织的登记和调查。 专门调查 专门调查又多为一次性调查

11 直接观察法 报告法 采访法 调查人员直接深入现场,对调查对象亲自观察和计量.如对商品库存的盘点等.
由报告单位根据一定的原始记录和统计台帐,依据统计报表的格式,要求,按隶属关系,逐级向有关部门提供统计数据的一种调查方式. 报告法 采访法 由调查人员向被调查者提问,根据被询问者的答复来搜集资料的一种方式.

12 调查者将要调查的项目列在一张问卷上,由被调查者依问卷项目作答,通过调查反映个人行为和态度的变量及其他调查项目,按统一测量标准,据此取得符合需要的资料.
问卷调查法 使用卫星高度分辨辐射计提供地面资料的方法,主要用于农作物产量.同时卫星遥感资料要与地面其他资料相印证,以便作出综合分析. 卫星遥感法

13 1.普查 普查:是专门组织的一种全面调查,它主要是用以搜集某些不能或不宜用定期报表搜集的统计资料。对国情国力的调查一般采用普查。
普查的特点: 〈一〉是一种非经常性的全面调查; 〈二〉比任何一种调查形式更能掌握大量、详细、 全面的统计资料。

14 普查的基本原则 (2)普查应力求在最短期限内完成,以保证调查资料的时效性,避免重复与遗漏.
(1)确定一个统一的调查时点,也称标准时间,使所有调查资料都必须反映这一时点上的状况. (2)普查应力求在最短期限内完成,以保证调查资料的时效性,避免重复与遗漏. (3)普查项目要有统一的规定,不得随意改变和增减,影响汇总和综合,降低资料的准确性和可比性. (4)普查应尽可能按周期进行,以便对统计数据进行动态分析,观察现象发展变化的情况及其规律性.

15 案例分析 该调查员的处理登记处理方法正确吗?
第五次全国人口普查的标准时间是11月1日零时,普查现场登记工作从11月1日开始到11月10日以前结束。调查员到过的几家遇到情况并作处理: (A)11月2日在1号家,这一家11月1日中午生个小孩,调查员把小孩的材料填入普查表; (B)11月3日在2号家。这一家11月2日一成员死亡,调查员把关于死亡的材料填入调查表; (C)11月4日到3号家。11月2日新婚夫妇到户籍登记处登记自己的婚姻,统计员将调查表有关项目填为已婚 该调查员的处理登记处理方法正确吗?

16 2.抽样调查 抽样调查:是一种非全面调查,抽样调查可以分为概率抽样和非概率抽样。概率抽样是按随机原则从调查对象中抽取一部分单位作为样本进行观察,然后根据样本数据去推算调查对象的总体特征。 概率抽样的特点: 〈一〉样本单位按随机原则抽取,排除了主观因素对选样的影响。 〈二〉根据部分调查的实际资料对调查对象总体的数量特征作出 估计。 〈三〉抽样误差可以事先计算并加以控制。 抽样调查的适用场合: 〈一〉不可能或不必要进行全面调查的社会现象,采用抽样调查; 〈二〉对普查资料进行必要的修正。

17 ··· ··· 抽样调查的组织方式: 简单随机抽样(纯随机抽样) 方法:将总体单位编成抽样框,而后用抽签或 随机数表直接抽取样本单位。
方法:将总体单位编成抽样框,而后用抽签或 随机数表直接抽取样本单位。 适用:总体规模不大;总体内部差异小 类型抽样(分层抽样) 方法:将总体全部单位分类,形成若干个类型组,后从各类型中分别抽取样本单位,合成样本。 等额分配 总体 N 样本 n 等比例分配 ··· ··· 最优分配

18 · · · · · · 抽样调查的组织方式: ······ 等距抽样(机械抽样)
方法:将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。 ······ (总体单位按某一标志排序) 排序依据的标志:(1)无关标志;(2)有关标志 整群抽样 方法: 将总体全部单位分为许多个“群”,然后随机抽取若干“群”,对被抽中的各“群”内的所有单位登记调查。 例:

19 例: 抽样调查的组织方式: 总体群数R=16 样本群数r=4 样本容量 M A C N B L P L D P J O F H D K E
S C N R B L P L D P J Q O F H D K E H U G I T

20 3.重点调查 重点调查:在调查对象中,只选择一部分重点单位进行的非全面调查。
重点单位:它们在所研究现象的标志总量中却占有绝大的比重,在总体中具有举足轻重的作用。对这些单位进行调查,能够从数量上反映整个总体在该标志总量方面的基本情况。 特点:可以了解较详细的情况,但无法对现象总体的数量特征作出准确的推算,也无法测算调查误差。 适用场合 :当调查任务只要求掌握基本情况,而部分单位又能比较集中地反映研究的项目,宜采用重点调查。

21 例如 选择鞍钢,上钢,武钢,太钢,包钢等几个钢铁企业进行调查,能及时了解全国钢铁生产的基本情况,虽然这几个钢铁企业在全国钢铁企业中只是少数,但它们的产量却占绝大比重,可以满足调查任务需要的资料.
注意 由于重点单位与一般单位的差别较大,通常不能由重点调查的结果来推算整个调查总体的指标.

22 指在数量表现上具有普遍意义和代表性的总体单位,可以用来推断总体的数量
统计调查的组织方式 在对调查对象有一定了解的基础上,有意识地选择少数典型单位 进行调查的一种非全面调查组织方式 典型调查 1、深入研究某些重大问题; 2、可以用来研究新生事物 3、估算总体数量特征,验证全面调查数字的真实性 指在数量表现上具有普遍意义和代表性的总体单位,可以用来推断总体的数量 不能确定推断的把握程度,无法计算和控制推断误差

23 典型调查的突出特点: 划类选典 典型单位的选择 取中选典 突出选典 1、调查单位是根据调查目的有意识地选择出来的
2、调查单位少,便于作深入细致的调查, 3、典型调查可以深入了解与事物发展有关的各种实际情况 划类选典 典型单位的选择 取中选典 突出选典

24 4.统计报表制度 统计报表制度:依照国家有关法规,自上而下地统一布置,以一定的原始记录为依据,按照统一的表式,统一的指标项目,统一的报送时间和报送程序,自下而上地逐级地定期提供统计资料的一种调查方式。 统计报表的主要特点: 〈一〉报表资料的来源是建立在各个基层单位的原始记的 基础上; 〈二〉由于统计报表是逐级上报和汇总的,各级领导部门 能获得管辖范围内的报表资料; 〈三〉是一种经常性的(连续性)调查,调查项目相对稳 定,有利于积累资料,并进行动态对比分析。

25 三、统计调查体系 统计调查体系:一个国家开展统计调查方法和制度的总称。 我国的统计调查体系:
建立以必要的周期性的普查为基础,经常性的抽样调查为主体,同时辅之以重点调查、科学推算和部分全面报表综合运用的统计调查方法体系。

26 四、统计调查方案的设计 〈一〉明确调查目的。 〈二〉确定调查对象和调查单位。 〈三〉设计调查项目。 〈四〉设计调查表格和问卷
调查对象,是指需要调查的现象总体。 调查单位,是指所要调查的具体单位。 报告单位亦称填报单位,它是负责向上报告调查内容、提交统计资料的单位。报告单位一般是在行政上、经济上具有一定独立性的单位。 〈三〉设计调查项目。 〈四〉设计调查表格和问卷

27 〈五〉确定调查时间。 〈六〉组织实施调查计划。 〈七〉调查报告的撰写。
调查时间是指调查资料所属的时间,在统计调查中,如果所调查的是时期现象,就要明确规定调查资料所反映的起止日期。如果所要调查的是时点现象,调查时间就是规定的统一标准时点。 调查期限是进行调查工作的时限,包括搜集资料和报送资料的工作所需的时间。 〈六〉组织实施调查计划。 〈七〉调查报告的撰写。

28 五、二手资料的主要来源渠道 1.统计年鉴 2.有关期刊 3.有关网站

29 模拟自测试题 1.单选题 1.对百货商店工作人员进行普查,调查对象是( ) A.各百货商店 B.各百货商店的全体工作人员
C.一个百货商店 D.每位工作人员 2.全国人口普查中,调查单位是( ) A.全国人口 B.每一个人 C.每一户 D.工人工资 3.对某城市工业企业的设备进行普查,填报单位是( ) A.全部设备 B.每台设备 C.每个工业企业 D.全部工业企业 4.某城市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄一般情况,则这种调查方式是( ) A.普查 B.典型调查 C.抽样调查 D.重点调查

30 5.人口普查规定统一的标准时间是为了( ) A.避免登记的重复与遗漏 B.确定调查的范围 C.确定调查的单位 D.登记的方便 6.有意识地选取几十块小麦地来估算某县小麦总产量,这种调查方式属于( ) A.重点调查 B.非全面调查 C.抽样调查 D.典型调查 7.要了解某市第一季度棉布生产的情况,调查年产量最大的几个织布厂,这种调查属于( ) A.普查 B.重点调查 C.典型调查 D.抽样调查 8.了解某企业产品质量,调查人员到现场进行观察检验,这种收集资料的方法属于( ) A.直接观察法 B.报告法 C.采访法 D.通讯法

31 2.多选题 1.某地区进行企业情况调查,则每一个企业是( ) A.调查对象 B.统计总体 C.调查单位 D.调查项目 E.填报单位
2.抽样调查的主要特点( ) A.以样本数值推断总体 B.划类选典 C.对总体的基本情况作出说明 D.按随机原则抽取样本 E.说明社会经济现象发展趋势 3.非全面调查包括( ) A.重点调查 B.抽样调查 C.快速普查 D.典型调查 E.报告法

32 4.统计调查按收集资料的方法,可以分为( ) A.采访法 B.抽样调查法 C.直接观察法 D.典型调查法 E.报告法 5.普查是一种( ) A.非全面调查 B.专门调查 C.全面调查 D.一次性调查 E.经常性调查

33 问卷调查 问卷设计 又称民意调查,是以社会成员对一定社会经济现象的看法和意愿为对象,从而推断社会心态动向的一种调查。
问卷调查一般是为了特定的调查目的,以问卷形式提问,由被调查者自愿回答的一种搜集资料的方法。 适用于社会经济生活中进行探索性、解释性、描述性等各项研究。

34 一、问卷设计步骤 1.根据调查目的,确定所需的统计数据,在此基础上进行问题的设计与选择。 2.确定问卷设计中问题的顺序,先易后难,先封闭性问题,后开放性问题。问题的排列要有关联,合乎逻辑,便于填卷人合作产生兴趣。 3.问卷的测试与修改。在问卷用于正式调查之前,先初选一些调查单位进行测试,根据发现的问题进行修改、补充和完善。

35 问卷的问题结构 指问卷中问题的排列顺序,其一般规则有: 按事实性问题、行为性问题、态度性问题的顺序将同类问题排列在一起,避免相互混杂
按问题的类型 事实性问题指被调查者的性别、年龄、文化程度等;行为性问题指被调查者对所提问题的实践情况或参与情况,如对某商品的使用次数、用量等;态度性问题指被调查者对所提问题的看法、感受等,如对某商品质量的满意程度,对某种社会活动的赞成与否等.

36 先易后难,先熟悉的问题后生疏的问题,先一般性后特殊
按问题的难易程度 为了便于被调查者记忆,可以按时间先后顺序排列 按问题的时间顺序 先近后远,由近及远 按问题的空间顺序

37 问卷的类型 按问卷的结构分 无结构型问卷 结构型问卷
问卷的内容结构较为松散或较为简单的问卷。调查者调查之前准备调查提纲,明确调查目的,拟定调查内容的项目,但不必事先列出答案格式,被调查者可以根据各自的情况自由回答。 无结构型问卷 指根据调查研究的目的和调查对象的特点而设计的具有结构的问卷。这种问卷一般都把所有拟调查的问题全部列于问卷上,并在问题的后面给出答案类型,由被调查者依照自己的认识和想法回答问题 结构型问卷

38 结构型问卷的问题类型: 您认为吸烟有哪些害处? 封闭式问题 您认为吸烟有哪些害处? 开放式问题 您认为吸烟有哪些害处? 容易控制,但不易全面
①危害自身健康 ②影响他人健康 ③浪费钱财 ④容易引起火灾 ⑤破坏家庭团结 封闭式问题 您认为吸烟有哪些害处? 开放式问题 您认为吸烟有哪些害处? ①危害自身健康 ②影响他人健康 ③浪费钱财 ④容易引起火灾 ⑤破坏家庭团结 ⑥其他( ) 容易控制,但不易全面 容易滋生腐败 不易控制,但内容丰富

39 调查单位中吸烟人所占比例 ⒈您是否吸烟(如果选②,则跳过⒉、 ⒊题)①吸烟 ②不吸 ⒉您每天大约吸多少支烟         ①5支以下 ②5-10支  ③10-15支     ④ ⑤20-25支 ⑥25支以上 ⒊您的吸烟历史大约有多长         ①1年以下 ②1-5年 ③5-10年 ④10年以上 ⒋您是否认为吸烟有害健康(请写出理由) 吸烟人群日吸烟数量情况 吸烟人群吸烟历史情况 调查对象对吸烟的看法

40 问卷设计的基本要求: 主题明确 提问科学 逻辑性强 容量适度 问题的提出要紧扣主题 问句和标准答案要易于理解和回答
先易后难、先封闭后开放、先基本问题后派生问题 以不超过20分钟为宜

41 ??????????????????????????????????????????
答题时间:一般控制在20分钟之内 ?????????????????????????????????????????? 过多的问题、过于难的问题将吓跑被调查者。

42 开头部分 甄别部分 主体部分 背景部分 二、问卷的内容 包括问候语、填表说明和问卷编号等内容,其文字必须简明易懂、能激发兴趣。
对被调查者过滤,筛选掉不需要的部分,针对特定的被调查者进行调查。 甄别部分 由一个个问题和相应选择项构成,包括调查项目、回答问题的方式等 主体部分 背景部分 有关被调查者的一些背景资料,调查者感激之情等

43 应届大学毕业生心态调查问卷 亲爱的同学:您好!
您在大学的学习即将结束,将要走上工作岗位。当前您最关心、最担心的问题是毕业就业问题。为了了解您在这方面有什么想法和看法、希望和要求,以便向各级党政领导及有关部门反映,以求得此问题较为合理的解决,我们开展了这次调查。 填写此问卷是不记名的。希望您在填答时不要有任何顾虑,根据您的实际情况如实填写,说出您的心里话。对此我们负责保密。 谢谢您的支持与合作! ****省调查队 调查的意义与目的 调查的保密性和安全性 表示感谢 注意事项 问题组织者的身份

44 填表说明 1、请在每一问题后所给的备选答案中选择符合您情况或您同意的答案,并在所选答案后的 内打“√”,或在问题的----处填写适当的内容。
填写方法 1、请在每一问题后所给的备选答案中选择符合您情况或您同意的答案,并在所选答案后的 内打“√”,或在问题的----处填写适当的内容。 2、若无特殊说明,每一问题只能选择一个答案;若还要对所选多项答案排序,则请按题后说明填写。 3、问卷内容较多,涉及面广,请在填答之前认真阅读一遍,然后按要求仔细填写。 填写要求

45 3.问卷问句的设计要有艺术性,避免对填卷人产生刺激而不能很好地合作。
三、问卷设计技术 问卷设计时应注意: 1.文字表达准确,不应使填卷人有模糊认识。 2.问卷要避免使用引导性的语句。 3.问卷问句的设计要有艺术性,避免对填卷人产生刺激而不能很好地合作。 4.问卷设计时要避免提不易回答的问题。

46 问卷内容设计 例1:“上个星期您总共看了几小时书?”其中“书”是否包括杂志、报刊?又如:“您每个月的收入是多少?”其中“收入”是否包括奖金、津贴和其他收入?上 例2:您为什么不喝牛奶而换喝豆浆?这一问句包含了三层意思:1、您为什么不喝牛奶?2、您为什么改喝豆浆而不改喝其它?3、什么原因使您更换流食? 例3:“大家都认为某教师的课上得好,您的看法如何?”,“政府的收购政策大家都认为好,您的看法呢?”

47 问卷内容设计 例4:“您至今未买电脑的原因是”A.买不起B.没有用C.不懂D.软件少。这里的提问容易引起填卷人反感、不愿合作或导致调查结果不准确。 例5:“您至今未买电脑的原因是”A.价格高B.用途较少C.性能不了解D.其他。这里的选项设计较上例而言更具有艺术性,能使被调查者愉快合作。

48 问卷内容设计 例5:“您父母赞同您的婚姻吗?”这里父母指两个人,若遇到父亲赞成、母亲反对或母亲赞成父亲反映,应答者如何回答呢?
例6:“您的职业是①企业职工;②经济管理人员;③干部;④商业服务人员;⑤农民;⑥军人;⑦学生;⑧教科文卫人员”。答案交叉重复现象很多,使应答者无所适从。

49 特殊问题的处理方法 你曾经有过偷漏税行为吗? 你曾经有过偷漏税行为吗? 你身份证末位数是单数吗? 你身份证末位数是单数吗?

50 设计调查问卷的其他注意事项 (1)避免应答者可能不明白的缩写、俗语或生僻的用语。比如,你对PPO的意见是什么?很可能不是每个人都知道PPO代表优先提供者组织(Preferred Provider Organization)。如果这一问题以一般公众为目标应答者,研究人员可能会遇到麻烦。另一方面,如果问题针对物理学家或医院管理者,那么缩写PPO很可能是可接受的。 (2)要具体。含糊的提问得到含糊的答案。例如,您的家庭收入是多少?当应答者给出此问题的数字答案时,其答案是各式各样的,如2001年的税前收入,2001年的税后收入,2002年税前收入,2002年税后收入。 (3)不要过头。当问题的要求过多时,人们是不会回答的,他们或者拒绝或者乱猜。例如,2003年您读了多少本书?需给出一个范围:①无;②1~10本;③11~25本;④26~50本;⑤多于50本。

51 设计调查问卷的其他注意事项 (4)确保问题易于回答。要求过高的问题也会导致拒答或猜想。例如,请您以购买新车时考虑因素的重要性将以下20项排序。你正在让应答者做一次相当大的计算工作。不要让人们为20项排序,应让他们挑选出前5项。 (5)不要过多假设,这是一个相当普遍的错误。问题撰写者默认了人们的一些知识、态度和行为。例如,您对总统关于枪支控制的立场倾向于同意还是反对?这一问题假设了应答者知道总统对枪支控制有一个立场并知道立场是什么。

52 设计调查问卷的其他注意事项 (6)注意双重问题和相反观点的问题,将多个问题结合起来或运用相反观点的问题会导致模棱两可的问题和答案。例如,“您赞同在私人住宅而不在公共场所吸食大麻合法化吗?”如果此问题精确描述应答者的立场,那么就很容易解释“是”这种回答。但是回答为“不”可能意味着应答者赞同在公共场所吸大麻而不赞同在私人场所吸,或两者都反对,或两者都赞同。“警察总长不应该对市长直接负责吗?”这个问题模棱两可,几乎任何回答都可以。

53 小故事:三千年前我国古代《周易》就阐述了“方以类聚,物以群分”的分类分组的思想,所谓“辨物”,即分辨事物,各同其党,使各自相同不间杂也。 前春秋战国时代管仲(名夷吾,公元前 )齐相国搞的“四民分业定居”方法。老先生经的多见的广,帮助齐桓公治国,把当时的百姓按照从属的行业分组,可说是按国民经济部门分组,分为士、农、工、商四类,把这四种人集中迁徙居住,设工商、士农之乡,大家各守其业,各司其职,安定了社会一定就培植了生产力,国力昌盛, 成就霸业,十年之后“九合诸侯,一匡天下”,齐国成为春秋当时的霸主。

54 第二节 统计数据的整理 一、数据整理概述 1.数据整理的含义: 对统计调查所搜集到的各种数据进行分类和汇总,又称为汇总性整理。
第二节 统计数据的整理 一、数据整理概述 1.数据整理的含义: 对统计调查所搜集到的各种数据进行分类和汇总,又称为汇总性整理。 2.统计数据整理的内容: (1)如何对所要研究的总体进行统计分组; (2)确定描述总体数量特征的统计指标体系。

55 二、统计分组基本理论 1.统计分组的概念 2.分组的性质 3.统计分组的种类
根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,称为统计分组。 统计分组标志:品质标志或数量标志 2.分组的性质 兼有分和合双重含义,对于现象总体,是“分”,对于单位,是“合”。 3.统计分组的种类 (1)按分组标志的多少,分为简单分组和复合分组 (2)按分组的标志的性质不同,分为品质分组(或称属 性分组)和数量分组(或称变量分组)。

56 三、统计分组的原则和方法 1.统计分组的原则: 2.统计分组的方法 (1)品质分组:按品质标志分组 (2)数量分组:按数量标志分组
穷尽原则:使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。 互斥原则:就是在特定的分组标志下,总体中的任何一个单位的只能归属于某一组,而不能同时或可能归属于几个组。 2.统计分组的方法 (1)品质分组:按品质标志分组 (2)数量分组:按数量标志分组 (A)单项式分组与组距式分组 (B)间断组距式分组和连续组距式分组“上限在不内”原则:凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内。 (C)等距分组与异距分组

57 分组 作用: 1·区分现象质的差别 25% 33% 42% 分组前 分组后 例:按所有制性质划分,我国现有8种经济类型:
国有经济;集体经济;私营经济;个体经济联营经济;股份制经济;外商投资经济;港澳台投资经济

58 例:中国农民家庭按收入分组的恩格尔系数(1984年)
2·反映现象总体的内部结构 例:上海市按GDP计算的三次产业结构(%) 1980年 1990年 年 1997年 GDP 第一产业 第二产业 第三产业 3·分析现象之间的相互依存关系 例:中国农民家庭按收入分组的恩格尔系数(1984年) 按收入分组(元) <200 <300 <400 <500 <600 <800 <1000 恩格尔系数(%)

59 按数量标志分组的形式 单项式分组 组距式分组
指用单一的数值作为分组标志的分组。每个数值作为一个组。 单项式分组 如某班学生按年龄分组:17岁,18岁,19岁,20岁, 21岁,22岁。 将作为分组依据的数量标志的整个取值范围依次划分为若干个满足互斥性和包容性的区间,用这些数值区间作为组的名称。 组距式分组 60分以下60—70分70—80分80—90分90分以上 某班学生统计学成绩分组

60 组距式分组中的一些概念 上限 区间数值的最大值 组限 下限 区间数值的最小值 组距 组中值 开口组 注意 每一组的区间长度 组距=上限-下限
每一组中点位置的数值 组中值 组中值=(上限+下限)÷2 开口组 缺少上限数值或下限数值的组 注意 开口组以相邻组的组距作为该组的组距,确定其下限或上限,再计算组中值。

61 某地区100个百货商店 月销售额与流通费用情况 如:组距d=U-L =100-50=50(万元) 上组限U
销售额(万元) 商店数(个) 每百元商品销售额中支付的流通费(元) 50以下 50~100 100~200 200~300 300以上 10 20 30 25 15 14.2 11.4 10.1 9.2 8.5 如:组距d=U-L =100-50=50(万元) 上组限U 如:组中值x=(U+L)/2 =( )/2 =150(万元) 下组限L

62 组距式分组中的一些概念 各组组距相等的分组称为等距分组。 等距分组 各组组距不全相等的分组称为异距分组。 异距分组 例如 组中值为
(60+50)÷2=55 60分以下60—70分70—80分80—90分90分以上 例如 组中值为 (90+100)÷2=95 上限不在内原则 各组组距相等的分组称为等距分组。 等距分组 各组组距不全相等的分组称为异距分组。 异距分组

63 练习 1.下列调查中,不属于按品质标志分组的是( ) A.人口按地区分组 B.人口按性别分组 C.人口按年龄分组 D.人口按文化程度分组
2.某连续变量数列,其末组为500以上.又如其邻近组的组中值为480,则末组的组中值为( ) A.520 B.510 C.530 D.540 3.某连续变量分为5组:第一组为40-50,第二组为50-60,第三组为60-70,第四组为70-80,第五组为80以上.依习惯规定( ) A.50在第一组,70在第四组B.60在第二组,80在第五组C.70在第四组,80在第五组D.80在第四组,50在第五组

64 四、频数分布 1.频数分布的基本理论 (1)频数分布的定义 (2)分布数列的两个要素
总体按某标志所分的组,若总体按数量标志分组,分组标志在各组有不同的数量表现,形成标志值数列,亦称变量,一般用x 表示; 各组所出现的单位数,即频数,亦称次数,用f 表示。

65 2.变量数列的编制方法 3.相关的概念: (1)频率 fi :第i组频数 (2)频率的性质 (A) ; (B) 。
(3)频数密度与频率密度: (A)频数密度=频数/组距 (2.9) (B)频率密度=频率/组距 (2.10)

66 五、累计频数与累计频率 1.向上累计频数(或频率)分布 2.向下累计频数(或频率)分布

67 频率与累积频率 各组单位数占总体单位总数的比重 频率 累计次数(频率)
从变量值低的组开始,将各组次数(频率)逐次向变量值高的组累计,说明某一组上限以下各组的累计次数(频率)。 从变量值高的组开始,将各组次数(频率)逐次向变量值低的组累计,说明某一组下限以上各组的累计次数(频率)。

68 销售额(百万元) 商店数 频率(﹪) 累计次数 累计频率(﹪) 5以下 5~10 10~15 15~20 20~25 25以上 4 10 16 13 3 8 20 32 26 6 合计 50 100

69 销售额(百万元) 商店数 频率(﹪) 累计次数 累计频率(﹪) 向上累计 5以下 5~10 10~15 15~20 20~25 25以上 4 10 16 13 3 8 20 32 26 6 14 30 43 47 50 28 60 86 94 100 合计

70 销售额(百万元) 商店数 频率(﹪) 累计次数 累计频率(﹪) 向上累计 向下累计 5以下 5~10 10~15 15~20 20~25 25以上 4 10 16 13 3 8 20 32 26 6 14 30 43 47 50 46 36 7 28 60 86 94 100 92 72 40 合计

71 即总体按一个标志进行分组。它只能从某一方面说明总体的分布状况和内部结构。
统计分组的形式 1、简单分组 2、复合分组 即总体按一个标志进行分组。它只能从某一方面说明总体的分布状况和内部结构。 复合分组是指对所研究的总体按两个或两个以上的标志层叠起来分组。可用于对事物多方面、多层次的分析研究。

72 对同一总体选择两个或两个以上标志分别进行简单分组。各分组标志表现并列使用。 平行分组体系
统计分组体系 指根据统计研究的要求,对同一总体进行多种不同的分组而成的一种相互联系,相互补充,从不同角度说明总体的内部状况的认识体系。 对同一总体选择两个或两个以上标志分别进行简单分组。各分组标志表现并列使用。 平行分组体系 各分组标志表现交叉结合使用。 交叉分组体系

73 平行分组体系 男性 按性别分类 女性 高级 对教师的分类 共计7组 按职称分类 中级 初级 青年 按年龄分类 中年

74 复合分组体系 共计12组2×3×2 按性别分类 高级 对教师的分类 按职称分类 中级 按年龄分类 初级 青年 中年

75 复合分组三种形式 某企业职工按工作岗位和工龄分组(单向复合分组) 按工龄分 人数 行政管理人员 5 工程技术人员 工人 按工作岗位分
30年以上 20-30 10-20 10年以下 小计 5 15 25 60 工程技术人员 8 52 100 工人 50 120 155 340

76 复合分组三种形式 某企业职工按工作性质和工龄分组(双向复合分组) 按工作性质分 行政管理人员 5 15 25 15 60 工程技术人员
按工龄分组 30年以上 年以下 合计 行政管理人员 工程技术人员 工人 合计

77 复合分组三种形式 调出 商品地区间调出额与调入额分组(棋盘式分组) 合计 A地 调 B地 出 C地 地 D地 区 E地 调入合计 调入地区
20000 17000 15000 10000 9000 调入合计 71000

78 第三节 统计数据的显示 一、统计表 1.统计表的定义和结构 (1)统计表的定义 (2)统计表的结构
第三节 统计数据的显示 一、统计表 1.统计表的定义和结构 (1)统计表的定义 (2)统计表的结构 (A)从表式上看,表格包括总标题、横行标题、纵栏标题和指标数值四个部分。 (B)从内容上看,统计表由主词栏和宾词栏两个部分组成。

79 2.统计表的分类 (1)开口式(2)标题(3)合计拦(4)数据 3.统计表的设计
(1)按主词的结构分类,根据主词是否分组和分组的程度,分为简单表、分组表和复合表。 (2)按宾词设计分类,可分为宾词简单排列、分组平行排列和分组层叠排列等三种。 3.统计表的设计 (1)开口式(2)标题(3)合计拦(4)数据 (5)计量单位(6)注释或资料来源。

80 二、统计图 1.直方图 2.折线图 3.曲线图 4.累计曲线图 洛伦茨曲线图 基尼系数,用以衡量收入分配的平等与否。

81 统计表 统计图 作用 利用表格形式,把一系列统计数字按照一定的次序和逻辑关系表达出来的一种方法。
指利用一定的图形,将有关统计资料按照一定的比例图示出来的一种方法。 统计图 1、是表达和运用统计资料的特有形式,是进行定量分析研究的基本方法 。 作用 2、使统计资料系统化、条理化、标准化。 3、清晰地显示社会经济现象的活动过程和现象之间的复杂关系

82 统计表的结构 总标题 横行标题 纵栏标题 数据资料 统计表的内容 总标题是表的名称,用来概括统计表中全部统计资料的内容。
是横行的名称,在统计表中通常用来说明统计数据反映的总体及其分组名称。 横行标题 纵栏标题是纵栏的名称,在统计表中通常用来表示统计指标的名称 。 纵栏标题 数据资料列在排在各横行标题与纵栏标题交叉的方格里 。 数据资料 主词 统计表所要说明的对象 统计表的内容 宾词是用于说明主词(总体及总体各组)特征而采用的统计指标 宾词

83 统计表的结构 2000年我国工业总产值和增加值 总标题 162885 81902 80983 85673.66 34094.51
企业单位数(个) 工业总产值(亿元) 工业增加值(亿元) 全国总计 轻工业 重工业 162885 81902 80983 纵栏标题 横行标题 指标数值 主词 宾词 表外资料 资料来源:《中国统计年鉴》2001年注释:工业总产值按工厂法计算。

84 统计表的结构 1999~2000年城镇居民家庭抽样调查资料 项目 单位 1999年 2000年 % 表的名称 纵栏标题 横行标题 指标数值
调查户数 平均每户家庭人口 平均每户就业人口 平均每户就业面 平均一就业者负担人数 平均每人全部年收入 #可支配收入 平均每人消费性支出 % 40044 3.14 1.77 56.43 4222.0 3.13 1.68 53.67 1.86 资料来源:《中国统计年鉴2001》,中国统计出版社,2001,第305页。 注:本表为城市和县城的城镇居民家庭抽样调查材料。 表的名称 纵栏标题 横行标题 指标数值 附加

85 统计表的种类 调查表 年末职工家庭就业人口调查表
统计表按用途不同可分为调查表、整理表和分析表 在统计调查中用于登记、搜集原始统计数据的表格。调查表只记录调查单位的特征,不能综合反映统计总体的数量特征。 调查表 年末职工家庭就业人口调查表 姓名 与户主的关系 性别 年龄 工作单位 职业 职务职称 被调查户主姓名 填表人 填表日期

86 又称汇总表,它是在统计整理或统计汇总过程中用于显示统计整理或统计汇总的结果的表格。一般由统计分组以及用来说明统计分组综合特征的统计指标两部分组成。
整理表 某年某市甲、乙两地工业企业从业人数、工业增加值和税金 按地域分组 从业人数 (万人) 工业增加值 (万元) 上缴税金(万元) 甲地 15.27 693.20 乙地 40.58 合计 55.85

87 分析表 在统计分析中用于显示统计数据,并对其进行定量分析的表格。 某年某市甲、乙两地工业企业从业人数、工业增加值和税金 按地域分组
人均工业增加值 (万元) 人均上缴税金 (万元) 甲地 45.40 乙地 242.52 合计 287.92

88 统计表的种类 空间数列表 时间数列表 时空数列结合表 统计表按统计数列的性质不同,可分为空间数列表、时间数列表和时空数列结合表
又称静态表,反映在同一时间条件下,不同空间范围内的统计数据的表格,用以说明静态条件下社会经济现象在不同空间的数量分布。 空间数列表 又称动态表,反映在同一空间条件下,不同时间的统计数列的表格。 时间数列表 又称动静结合表,既说明社会经济现象在不同空间的数量分布,又说明它们在不同时间上的数量分布。 时空数列结合表

89 我国1990-1995国内生产总值 我国华北地区国内生产总值
年份 1990 1991 1992 1993 1994 1995 国内生产总值 我国华北地区国内生产总值 年份 地区 1996 1997 1998 1999 北京 天津 河北 山西

90 简单表 第四次人口普查我国三个直辖市的人口 (1990年7月1日零时) 单位:人 城市名称 人口数 其中:市辖县的人口数 北京市 天津市
 (1990年7月1日零时) 单位:人 城市名称 人口数 其中:市辖县的人口数 北京市 天津市 上海市 10819407 8787402 13341896   3456982   2930334   5172460

91 统计表的种类 简单分组表 某地区2002年各类型企业总产值表
表的主词按某一标志进行简单分组的统计表.分组表的主词可以按品质标志分组,也可按数量标志分组. 简单分组表 某地区2002年各类型企业总产值表 企业按规模分组 总产值 (亿元) 比上年增 长(%) 大型企业 中型企业 小型企业 合计

92 简单分组表 某班统计学考试成绩表 按考试成绩分组(分) 学生人数(人) 60以下 60~70 70~80 80~90 90以上 3 8 9
合计 35

93 统计表的种类 复合分组表 指表的主词按两个或两个以上标志进行层叠分组的统计表 某中学学生构成情况表 单位:人 按学科 按性别 文科 理科
某中学学生构成情况表 单位:人 按学科 按性别 文科 理科 合计 男性 女性 100 160 200 300 260 560

94 宾词指标的设计 构成统计表另一组成部分宾词是说明总体的统计指标.对这类统计指标进行分组整理,通常称为宾词的设计.宾词的设计分为不分组设计,简单设计和复合设计. 对宾词指标不进行任何分组,直接把各项指标在表中平行排列. 不分组设计 黄金和外汇储备 年份 黄金储备(万盎司) 国家外汇(亿美元) 1993 1994 1995 1996 1267 211.99 516.20 735.97 1050.29

95 简单设计 按不同的分组标志对宾词指标进行简单分组,然后将几种不同的分组在表中进行排列. 某企业各车间人员的性别和受教育程度 车间 全部人员
合计 其 中   性别   教育程度 男 女 初等教育 中等教育 高等教育  第一车间 第二车间 第三车间

96 复合设计 将宾词指标按两个或两个以上的分组标志进行复合分组,做层叠排列. 某企业各车间人员性别和教育程度 车间 全部人员 合计 其 中
其 中   初等教育  中等教育 高等教育 男 女 合计 男 女 合计 男 女 合计  第一车间 第二车间 第三车间

97 统计表的设计与编制规则 必须遵循科学、实用、简炼、美观的原则
上下两端的端线以粗线或双线绘制,表的左右两边习惯上不划线,采用不封闭的“开口”表式 数字应填写整齐,数位对准,计量单位按规定填写 可在各列的文字标题下面设置编号加以标识 数据栏不能有空白。当某项数字免填时可用点或线填充

98 四、统计图 统计图的分类 几何图 按图形分 象形图 统计地图
用几何的线和形来表示和分析统计资料的统计图。如条形图、曲线图、圆形图、方块图、树形图、平面图和立体图等 几何图 按图形分 是利用现象本身形象的简化来表述和分析统计资料的统计图 象形图 在地图上用点、线、图来表述和分析统计资料的统计图,用来反映现象数量在地区上的分布状况 统计地图

99 几种常用的统计图 用于显示离散型变量的次数分布。最主要是显示品质数列频数分布 条形图 (Bar)

100 几种常用的统计图 对总体不进行分组,即用一个图形代表一个总体而构成的条形图. 简单条形图 (Bar)

101 两个或两个以上的条形为一组,并列若干组条形构成的统计图.即可进行每组各条形间的比较,也可对各组同类条形进行比较.
复合条形图(Bar)

102 51 9 16 10 2 112 40 80 120 广 告 类 型 其他广告 招生招聘广告 房地产广告 金融广告 服务广告 商品广告
人数(人) 51 9 16 10 2 112 40 80 120 商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告 广 某城市居民关注不同类型广告的人数分布

103 三维图表

104 直方图是用矩形的宽度和高度来表示频数分布的图形.在平面坐标系中,横轴表示数据分组,纵轴表示频数或频率.
直方图(Histogram)

105 分组数据的图示 (直方图的绘制) 直方图下的面积之和等于1 我一眼就看出来了,销售量在170~180之间的天数最多! 频 数 (天) 25
20 15 10 5 30 180 190 200 170 210 160 220 140 150 240 230 某电脑公司销售量分布的直方图

106 直方图 条形图

107 圆形图(饼图 Pie) 用于显示定类变量的次数分布

108

109

110 分类数据整理—频数分布表 (例题分析) 【例】一家市场调查公司为研究不同品牌饮料的市场占有率,对随机抽取的一家超市进行了调查。调查员在某天对50名顾客购买饮料的品牌进行了记录,如果一个顾客购买某一品牌的饮料,就将这一饮料的品牌名字记录一次 。右边就是记录的原始数据 绿色 健康饮品

111 分类数据的图示—条形图 (例题分析)

112 分类数据的图示—饼图 (例题分析)

113 环形图 8% 36% 31% 15% 7% 33% 26% 21% 13% 10% 非常不满意 不满意 一般 满意 非常满意
甲乙两城市家庭对住房状况的评价

114 (annular chart) 环形图 环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段表示 环形图与圆形图类似,但又有区别
圆形图只能显示一个总体各部分所占的比例 环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环 环形图可用于结构比较研究 环形图主要用于展示分类和顺序数据

115  线图    (Line) 主要用于显示连续型变量的次数分布和现象的动态变化

116 ¥ $ 时间序列数据—线图 (例题分析) 【例】已知1991~2000年我国城乡居民家庭的人均收入数据如表。试绘制线图 年份 城镇居民
时间序列数据—线图 (例题分析) 【例】已知1991~2000年我国城乡居民家庭的人均收入数据如表。试绘制线图 1991~2000年城乡居民家庭人均收入 年份 城镇居民 农村居民 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 1700.6 2026.6 2577.4 3496.2 4283.0 4838.9 5160.3 5425.1 5854.0 6280.0 708.6 784.0 921.6 1221.0 1577.7 1926.1 2091.1 2162.0 2210.3 2254.4

117 时间序列数据—线图 (例题分析)

118 散点图(Scatter) 主要用来观察变量间的相关关系,也可显示数量随时间的变化情况

119 分组数据的图示 (折线图的绘制) 频 数 (天) 25 20 15 10 5 30 折线图与直方图 下的面积相等!
140 150 160 170 180 190 200 210 220 230 240 某电脑公司销售量分布的折线图

120 分组数据—折线图 (frequency polygon)
折线图也称频数多边形图 是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉 折线图的两个终点要与横轴相交,具体的做法是 第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴 折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的

121 箱式图

122

123 三、频(次)数分布图的类型 1.钟型分布 钟型分布示意图 (Ⅰ) (Ⅱ) (Ⅲ)

124 2.U型分布 死 亡 率 图2-7 U型分布示意图 年龄 (‰) 50 40 30 20 10
50 40 30 20 10 (‰) 年龄

125 3.J型分布 J型分布示意图 正J型图 反J型图


Download ppt "第二章 统计数据的搜集、整理与显示 第一节 统计数据的搜集 第二节 统计数据的整理 第三节 统计数据的显示."

Similar presentations


Ads by Google