Download presentation
Presentation is loading. Please wait.
1
第一章 统计学及其基本概念 南京财经大学统计学系
2
本章内容 第一节 统计学简介 第二节 数据及其分类 第三节 统计总体、个体与样本 第四节 标志、指标与指标体系 第五节 统计计算工具
第一节 统计学简介 一、统计的涵义 二、统计的过去与现在 三、统计学在经济管理中的应用 第二节 数据及其分类 一、认识数据 二、数据类型Ⅰ 三、数据类型Ⅱ 四、数据类型III 五、数据类型IV 第三节 统计总体、个体与样本 一、统计总体和个体 二、总体的特点 三、样本 第四节 标志、指标与指标体系 一、统计标志 二、统计指标 三、统计指标体系 第五节 统计计算工具 一、统计分析软件简介 二、Excel实现数据处理的主要途径
3
一、统计的涵义 1. 统计工作(statistical work) 2. 统计资料(statistics, statistical data) 3. 统计学(statistics)
4
1. 统计工作(statistical work)
统计工作是为了管理或认识的需要,对社会经济现象和自然现象进行数量收集的活动。 主要做三件事:统计数据的采集、对采集的数据进行加工处理、对加工整理过的数据进行分析 统计局系统 企业信息化
5
2. 统计资料(statistics, statistical data)
统计资料是统计工作过程中所取得的各项数字资料以及与之相关信息的总称。统计资料是统计工作取得的能够说明所研究对象的数据。例如国内生产总值数据,说明整个国家的生产规模。这些数据经常会在报纸、杂志上出现。
6
3. 统计学(statistics) 统计学是在统计工作的经验积累到一定程度时自然产生的,它是收集、整理、描述分析统计数据的方法和技术,为我们的决策提供“量”方面的依据。 《不列颠百科全书》对统计学的定义为:“统计学是关于收集和分析数据的科学和艺术”。
9
二、统计的过去与现在 (一)统计学中的各大著名学派 国势学派 政治算术学派 3 . 数理统计学派 社会统计学派 (二)统计学的现代格局
10
国势学派 人物: 【德国】康令和阿亨瓦尔 贡献: 提出世界公认的名词-统计学(Statistics) 评价: “有统计之名,无统计之实”的学派
11
政治算术学派 人物: 【英国】威廉·配第和约翰·格朗特 贡献: 开用数量方法研究社会经济现象之先河 评价: “有统计之实,无统计之名”的学派
12
数理统计学派 人物: 【比利时】人才济济。如:凯特勒、戈赛特 、费希尔、内曼、卡尔 皮尔逊 贡献: (1)完成统计学和概率论结合 (2)建立了丰富的数理统计理论
13
社会统计学派 人物: 【德国】克尼斯、恩格尔和梅尔 观点: 统计学的研究对象是社会现象,目的在于明确社会现象的内在联系和相互之间的关系。 在研究过程中,要用全面调查,也可以适量的使用抽样调查。
14
(二)统计学的现代格局 格局:一是以社会经济问题为主要研究对象的社会经济统计; 二是以方法和应用研究为主的数理统计。 从学科的角度看,前者从属于应用经济学;后者从属于数学。 趋势:使用计算机统计分析软件对数据进行处理成为必然; 统计学从有关领域中吸取的养分也越来越多。
15
三、统计学在经济管理中的应用 统计给我们智慧与力量 统计学在经济领域的应用 (案例 案例2) 统计学在管理领域的应用 (案例 案例2)
16
案例1 1995年9月,美国斯坦福大学经济学教授刘遵义就通过实证比较,数量分析和模糊评价等方法,预测出菲律宾、韩国、泰国、印尼和马来西亚有可能发生金融危机。
17
案例2 2005年3月16日上证平均指数中30支股票的市盈率是21.08。东方电子集团有限公司的市盈率是17.92。这时,市盈率方面的统计信息显示:与上证指数股票的平均收入相比,东方电子集团有限公司的股票价格较低。因此,投资顾问可以得出结论:东方电子集团有限公司的现行价格低估了。
18
案例1 一家会计师事务所想确定客户的资产负债表中所显示的应收账款的数量是否公正地体现了实际的应收账款的数量。通常,应收账款的账目数量很大,要审查和验证每个账户既费时又费钱。 怎么办? 抽样调查可以解决问题!
19
案例2 零售付账柜台使用电子扫描仪收集数据,可供各种营销研究应用。 数据挖掘的典型: 啤酒与纸尿裤
20
现代汉语词典对数据的解释是:进行各种统计、计算、科学研究或技术设计等所依据的数值。我们提供四个数据集,让大家对数据有一个直观的了解。
一、认识数据 1. 中国历年主要宏观经济指标数据集(数据集01) 年世界各国基本情况数据集(数据集02) 3. 公司人力资源部数据集(数据集03) 4. 企业流水线上的抽样数据集(数据集04) 现代汉语词典对数据的解释是:进行各种统计、计算、科学研究或技术设计等所依据的数值。我们提供四个数据集,让大家对数据有一个直观的了解。
21
数据集1 中国历年主要宏观经济指标数据集
22
数据集2 1995年世界各国基本情况数据集
23
数据集3 公司人力资源部数据集
24
数据集4 工厂流水线上的抽样数据集
25
数据类型Ⅰ 1. 分类数据(categorical data) 2. 顺序数据(rank data)
3. 数值型数据(metric data)
26
分类数据(categorical data)
分类数据是对事物进行分类的结果,数据的主要特征是采用文字、数字的代码和其他符号对事物进行简单的分类和分组。 分类数据以定类尺度(nominal scale)来衡量。
27
顺序数据(rank data) 即:等级数据 是对事物进行分类的结果,只是这些分类在语义上表现出明显的等级或顺序关系,例如,学生的成绩可以分为优秀、良好、中等、及格和不及格。 顺序数据以定序尺度(ordinal scale)来衡量。
28
数值型数据 数值型数据是使用自然或度量衡单位对事物进行测量的结果,其结果表现为具体数值。 数值型数据有两种衡量尺度:
一是定距尺度(interval scale) 二是定比尺度(ratio scale) 区别:“零点”
29
数据类型Ⅱ 1. 时间序列数据(time series data) 2. 截面数据(cross-sectional data)
3. 面板数据(panel data)
30
时间序列数据 时间序列数据(time series data)是在不同时间上收集到的数据,它所描述的是现象随时间而变化的情况。
31
截面数据 截面数据(cross-sectional data)是在相同或近似相同的时间点上收集的数据,它所描述的是现象在某一时刻或某一时间段的变化情况。
32
面板数据 是对若干个单位在不同时间进行重复跟踪调查所形成的数。例如,我们连续20年收集得到的企业工人的工资、受教育程度和就业情况的数据。
33
数据类型III 1. 绝对数(absolute number) 2. 相对数(relative number)
3. 平均数(average)
34
绝对数 是统计数据的基本表现形式,是其他指标形式形成的基础。现象的总体规模和水平一般都以绝对数形式表现,一个地区的总人口、国内生产总值、货物周转量等都是绝对数,其计量单位有实物单位、价值单位和复合单位三种。 绝对数按其所反映的时间状况不同可以分为时期数和时点数。时期数是反映现象在一段时期内的总量。如产品产量、产值、销售额等。时期数的特点是可以连续计数,并可以累积。时点数是反映现象在某一瞬间时刻上的总量,如人口数、商品的库存量、企业的固定资产价值等。由于时点数是反映现象在某一瞬间点上的水平,因而只能间断计数,各时点不能累积。
35
相对数 是由两个相互联系的绝对数对比得到,反映事物的相对数量。
常用的相对数包括:结构相对数、动态相对数、比较相对数、计划完成相对数。结构相对数是在对资料进行分组的基础上,以总体的总量作为比较的标准而得到的相对数。动态相对数是将不同时期的同类事物的水平加以比较求得的相对数。比较相对数是将不同单位的同类现象对比得到的相对数。计划完成相对数将实际完成数与计划完成数对比用以反映计划的执行情况,对于产出类指标,如产量,大于100%说明完成了规定的任务,而对于投入类指标,如成本,则小于100%说明完成任务。
36
平均数 反映现象总体的一般水平。平均数的计算将在第四章详细介绍。
37
五、数据类型IV 变量(variable)是说明现象某个数量特征的概念。
其最常见的分类是:离散型变量(discrete variable)和连续型变量(continuous variable)。这两类变量获取的方法不同,离散型变量一般用“点数”的方法取得,数值往往是整数,如职工人数、企业个数、设备台数等。连续型变量用“测量”取得,测量的仪器越精密,变量值就会越精确,如人的身高、体重;产品的长度、重量等。 变量按其所受因素的影响不同,还可分为确定性变量和随机变量(random variable)。受确定性因素影响的变量称为确定性变量。受随机性因素影响的变量称为随机变量,所谓随机因素,是指各种不确定的、偶然性的因素,这种因素对变量影响的大小和方向都是不确定的,通常是微小的。
38
总体与个体 统计总体,简称总体Population),就是统计所要研究的事物或现象的全体,即由客观存在的,具有某种共同特征的许多个别事物构成的整体。 个体(Item Unit)是构成统计总体的个别事物,又称为总体单位。
39
总体的特点: 1、大量性 2、同质性 3 、差异性 4、相对性
40
样本 样本(Sample)是指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。 抽取原则:随机、非随机
非随机抽样:任意抽样、判断抽样、配额抽样
41
标志 统计标志,简称标志(characteristic),是指每个个体所共同具有的属性或特征,它是说明个体的属性或特征的具体名称。
标志按其性质分为品质标志和数量标志。 标志按变异情况分为不变标志和可变标志。 可变的数量标志称为变量,其值称为变量值。
42
指标 统计指标,简称指标(indicator),是反映总体数量特征的,由各个个体的标志值汇总综合而成。任何一个统计指标都是经过了从个别到一般、从具体到抽象的过程,它体现总体特征,具有综合性。 (一)口径一致是统计指标的基本要求 (二)统计指标按反映问题的数量特征分类 (三)统计指标按核算的范围分类
43
(一)口径一致是统计指标的基本要求 1. 统计指标是反映研究对象总体特征的,确定研究对象往往与一定的理论相联系,理论定义的范畴应该和实际获得的指标数值的口径统一。 2. 统计口径包括两个方面:一是计算口径外延的明确定义,。二是计算口径维度的正确把握。
44
(二)统计指标按反映问题的数量特征分类 1. 数量指标 2. 质量指标
它是反映客观事物的规模或水平的指标,它表现为汇总后直接得到的绝对数或总量,又称之为总量指标或绝对指标。数量指标是最基本的指标,它是计算其他指标的基础。 数量指标包括标志总量和总体单位总量,如总产值、工资总额、人口总数、企业个数等。 2. 质量指标 它是反映客观现象之间的相互联系、比例关系、发展速度、内部结构的指标,一般用相对数或平均数表示。如劳动生产率、成本利润率、人均国民收入等。质量指标是由两个数量指标对比求得的,它是由数量指标派生的。
45
(三)统计指标按核算的范围分类 1. 总体指标,即总体参数,简称参数(parameter),是我们想要了解的总体的某个特征值。
2. 样本指标,即样本统计量,简称统计量(statistic)。统计量是根据样本数据计算出来的一个量。
46
指标体系 一系列相互联系、相互制约的多个统计指标就构成统计指标体系。 举例1:工业企业统计指标体系 ~企业管理与信息处理指标子体系
举例2:宏观统计指标体系 ~国民经济核算体系
47
企业管理与信息处理指标子体系 工业企业经营管理指标 工业企业企业管理指标 信息获取与利用指标 工业企业财务管理指标 工业企业经济效益评价指标
48
国民经济核算体系
49
一、统计分析软件简介 1、SAS 2、SPSS 3、Statistica 4、MINITAB 5、马克威分析系统
50
1.SAS系统全称为Statistics Analysis System,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。SAS早期的主要功能是统计分析,其产品与解决方案除统计分析外,新增了数据整合、企业智能等,统计分析功能也在不断增加。 SAS统计系统是由多个功能模块组合的,其基本部分是BASE SAS模块,它是SAS统计分析系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。在BASE SAS的基础上,可以增加模块而增强数据分析功能:SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)、SAS/FSP(快速数据处理的交互式菜单系统模块)、SAS/AF(交互式全屏幕软件应用系统模块)等等。一般认为使用SAS需要编写程序, 比较适合统计专业人员,而对非统计专业人员则比较困难。事实上SAS的很多功能也可以通过菜单操作实现,如Insight就是一个菜单操作的界面。
51
2. SPSS是软件英文名称的首字母缩写,原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”,2000年SPSS公司将英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向做出了重大调整。逐渐由原来的单一统计产品开发与销售转向企业、教育科研及政府机构提供全面信息统计决策支持服务,成为走在了最新流行的“数据仓库”和“数据挖掘”领域前沿的一家综合统计软件公司。SPSS最突出的特点就是操作界面极为友好,采用类似EXCEL表格的方式输入与管理数据,数据接口通用,能方便的从其他数据库中读入数据,是非统计专业人员的首选统计软件。
52
3. Statistica是由美国俄克拉荷马州的StatSoft公司研制的大型专业统计图表分析软件包。Statistica数据统计分析项目有15个主命令,130多个子命令,其功能是:基本统计分析(Basic Statistics)、非参数统计分析(Nooparametrics)、方差分析(General ANOVA)、多元回归分析(Multiple Regression)、非线性估计(Nonlinear Estimation)、时间序列预测(Time Series / Forecasting)、聚类分析(Cluster Analysis)、因子分析(Factor Analysis)、典型分析(Canonical Analysis)、多维尺度分析(Multidimensional Scaling)、路径分析(SEPATH)、可靠性/项目分析(Reliability/Item Analysis)、判别分析(Discriminant Analysis)、对数线性分析(Log-linear-analysis)和生存分析(Survival Analysis)。Statistica的图形功能很完备,显示输出的图形细腻美观,有13个主命令,80多个子命令,主要包括:快速统计图(Quick Stats Graphs)、二维统计图(Stats 2D Graphs)、三维序列统计图(Stats 3D Sequential Graphs)、三维XYZ统计图(Stats 3D XYZ Graphs)和统计矩阵图(Stats Matrix Graphs)等。
53
4. MINITAB是由美国宾夕法尼亚州立大学在1972年研制的统计分析软件包,它以无与伦比的易学性、可靠性以及完善的功能而著名于世,是教授统计学,实施六西格玛和其他质量改进项目的理想选择,MINITAB包括统计分析模块和绘制图形模块,统计分析模块有13个主命令:基本统计分析(basic statistics)、回归分析(regression)、方差分析(ANOVA)、实验设计(DOE,Design of Experiments)、控制图(control charts)、质量编制计划工具(Quality Tools)、可靠性/生存分析(reliability / survival)、多变量分析(Multivariate)、时间序列分析(Time series)、统计报表和列联表检验(Tables)、非参数检验(Nonparametrics)、探索性数据分析(EDA, exploratory data analysis)、效能与样本量分析(power and sample size)。
54
5. 马克威分析系统是由上海天律信息技术有限公司开发的中国第一套完全自主知识产权的大型统计分析和数据挖掘系统。马克威分析系统在技术上的特点是:将数据挖掘、统计分析、图形展示和智能报表融为一体,为用户提供完整配套的决策支持工具;提供独创的优化算法体系和完备的数据挖掘模型;将可视化数据分析与数据挖掘有机地融合在一起,并将自主开发的嵌入式数据库管理系统同其它关系型数据库实现了无缝连接;它在设计上充分考虑了中国用户的实际情况和使用习惯,将实用性和科学性结合在一起。
55
二、Excel实现数据处理的主要途径 1.公式和函数 2. 数据分析工具
Similar presentations