第七章 相关分析 学习要点:本章详细讲述了相关分析的概念、相关关系的测定、回归方程的建立和应用等内容。通过本章的学习,要理解相关分析的有关概念,掌握计算相关系数和配合回归方程的方法,并能够结合实际资料对变量进行相关分析。 §1、相关的意义和种类 §2、相关图表和相关系数 §3、回归分析
第一节 相关的意义和种类 一、相关分析的意义: 1、统计分析的重要课题: 第一节 相关的意义和种类 一、相关分析的意义: 1、统计分析的重要课题: 2、在总体中,如果对变量x的每一个数值,相应还有第二个变量y的数值,则各对变量的变量值所组成的总体称为二元总体;由二个以上相互对应的变量组成的总体,称为多元总体。 3、对二元总体应了解的问题 两变量是不是存在关系,关系的密切程度如何 如果存在关系,那么关系的具体形式是什么 怎样根据一个变量的变动来估计另一变量的变动
二、相关分析的概念 1、相关分析就是对总体中确实具有联系的标志进行分析,其主体是对总体中具有因果关系标志的分析。 2、现象总体的依存关系类型: 因素标志是决定结果标志发展的条件,根据结果标志对因素标志的不同反应,可分两种类型。 函数关系是当因素标志的数量确定之后,结果标志的数量也随之完全确定,以y=f(x)表现 相关关系是不完全确定的随机关系。因素标志的数值,可能有若干结果标志的数值。
3、函数关系与相关关系的联系 对具有相关关系的现象进行分析时,则必须利用响应的函数关系数学表达式,来表明现象之间的相关方程式。 相关关系是相关分析的研究对象,函数关系是相关分析的工具。 例:圆的面积与半径的关系;计件工资总额与零件数量;看书时间和学习成绩。
三、相关的种类 1、按相关的程度分为完全相关、不完全相关和不相关。 两种依存关系的标志,其中一个标志的数量变化由另一个标志的数量变化所确定,则称完全相关,也称函数关系。 两个标志彼此互不影响,其数量变化各自独立,称为不相关。 两个现象之间的关系,介乎完全相关与不相关之间称不完全相关。
2、按相关的方向分为正相关和负相关 正相关指相关关系表现为因素标志和结果标志的数量变动方向一致。 负相关指相关关系表现为因素标志和结果标志的数量变动方向是相反的。 3、按相关的形式分为线性相关和非线性相关 一种现象的一个数值和另一现象相应的数值在直角坐标系中确定为一个点,称为线性相关。 4、按影响因素的多少分为单相关和复相关。 如果研究的是一个结果标志同某一因素标志相关,就称单相关。 如果分析若干因素标志对结果标志的影响,称为复相关或多元相关。
四、相关分析的主要内容 1、确定相关关系的存在,相关关系呈现的形态和方向,相关关系的密切程度(主要方法是绘制相关图表和计算相关系数) 2、确定相关关系的数学表达式 3、确定因变量估计值误差的程度。
第二节 相关图表和相关系数 一、相关表的编制 1、编制相关表前首先要通过实际调查取得一系列成对的标志值资料作为相关分析的原始数据。 第二节 相关图表和相关系数 一、相关表的编制 1、编制相关表前首先要通过实际调查取得一系列成对的标志值资料作为相关分析的原始数据。 2、相关表的分类: 简单相关表是资料未经分组的相关表,它是把因素标志值按照从小到大的顺序并配合结果标志值一一对应而平行排列起来的统计表。 分组相关表是在简单相关表的基础上,将原始数据进行分组而编成的统计表。
①、单变量分组相关表 自变量分组并计算次数,而对应的因变量不分组,只计算其平均值。 单变量分组相关表的特点:使冗长的资料简化,能够更清晰地反映出两变量之间相关关系。 ②、双变量分组相关表: 自变量和因变量都进行分组而制成的相关表,这种表形似棋盘,故又称棋盘式相关表。
二、相关图的编制 1、相关图:利用直角坐标系第一象限,把自变量置于横轴上,因变量置于纵轴上,而将两变量相对应的变量值用坐标点形式描绘出来,用以表明相关点分布状况的图形。 2、相关图被形象地称为相关散点图 3、因素标志分了组,结果标志表现为组平均数,所绘制的相关图就是一条折线,这种折线又叫相关曲线。
三、相关系数的计算: 1、符号系数:把两个同平均值的离差数列做对称比较。 ①如果一个数列的离差与另一个数列的离差有很多同号,就可以认为这两标志之间存在正相关。 ②如果大多数为异号,就可以认为他们之间存在负相关。 ③如果同号与异号大体一样,显然不存在相关。 符号系数K
分析 ①、K= -1时,标志间的相关是负相关 ②、K= +1时,标志间的相关是正相关 ③、K= 0 时, 标志间不存在相关 例:P179表7-8 符号系数的优点在于意义明了,计算方便,其缺点在于掩盖了离差绝对值上的不同,指标只能反映相关的一般趋势。
2、相关系数(着重研究线性的单相关系数) 定义:是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度。 公式:
协方差 的意义 ①、显示x与y是正相关还是负相关 协方差为负,是负相关, 协方差为正,是正相关。 ②、协方差显示x与y相关程度的大小 当相关点在四个象限呈散乱的分布,相关程度很低 当相关点分布在x与y的平均值线上时,表示不相关 当相关点靠近一直线,表示相关关系密切 当相关点全部落在一直线,表示完全相关
相关系数r的性质: ①、当 时,x与y为完全线性相关,它们之间存在确定的函数关系。 ②、当 时,表示x与y存在着一定的线性相关,r的绝对值越大,越接近于1,表示x与y直线相关程度越高,反之越低。
相关系数的r的简化式:
第三节 回归分析 一、回归分析的意义: 1、回归分析就是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确立一个相应的数学表达式,以便从一个变量来推测另一个未知量,为估算预测提供一个重要的方法。 2、回归分析和相关分析是互相补充、密切联系的,相关分析需要回归分析来表明现象数量关系的具体形式,而回归分析则应该建立在相关分析的基础上。
3、回归的种类 按自变量的个数分: 一元回归:只有一个自变量,又称简单回归 多元回归:有两个或两个以上自变量,又称复回归 按回归线的形状分: 线性回归—直线回归 非线性回归—曲线回归
二、简单线性回归方程: 1、简单线性方程式:y=a+bx 2、变量y不仅受x的影响,还受其他随机因素的影响,因此通过相关图,可以直观地发现各个相关点并不都落在一条直线上,而是在直线上下波动,只呈现线性相关的趋势。 3、我们试图在相关图的散点中引出一条模拟的回归直线,以表明两变量x与y的关系,称为估计回归线,回归方程:yc=a+bx yc—y的估计值 a—纵轴截距 b—回归系数,代表自变量增加一个单位时因变量的平均增加值。
4、计算a、b值 当实际值y与估计值yc的离差平方和为最小值时,则此直线为最优的理想直线。 即:
当出现权数时:
5、回归系数b与相关系数r的关系 6、回归分析和相关分析的特点: 回归分析是研究两变量之间的因果关系,所以必须通过定性分析来确定哪个是自变量,哪个是因变量。 回归分析是研究两变量具有因果关系的数学形式 回归分析中回归系数有2个(区分自变量、因变量) 相关分析中相关系数有1个(不区分自变量、因变量) 对于回归方程进行预测估计时,只能根据x估计yc,不能根据yc估计x
三、估计标准误 1、当yc(估计值)与y(实际值)有偏差的时候,产生估计值代表性问题。 2、估计标准误是用来说明回归方程代表性大小的统计分析指标,计算公式为
四、估计标准误与相关系数的关系 1、 2、估计误差最小为0,即y-yc=0,所有y点落在yc线上, Y与x为完全的相关关系。(函数关系) 估计误差最大为总误差,即yc- =0,yc与 重合,y与x不相关。
第八章指数数列 学习知识点:本章讲述指数的意义、指数的编制、指数体系和指数数列等内容。学习本章要求掌握综合指数、平均指数的编制方法,并能进行熟练地计算各种指数,在此基础上,运用指数体系进行因素分析。 §1、指数的意义和种类 §2、综合指数和平均指数 §3、现实中的几种经济指数 §4、因素分析 §5、指数数列
§1、指数的意义和种类 一、指数的意义: 1、现象总体的区分: 简单现象总体:指总体中的单位数或标志值可以直接加以总计。 复杂现象总体:指构成现象总体的单位及其标志值不能直接加总。 2、指数的区分: 广义上:反映事物现象数量变动程度的相对数 狭义上:指由不能直接相加的多要素所构成的现象总体数量对比关系的一种相对数。
3、指数的作用: 综合反映复杂现象总体数量上的变动状态 分析现象总体变动中受各个因素变动的影响程度。 利用连续编制的指数数列,对复杂现象总体长时间发展变化趋势进行分析。
二、指数的种类 1、按反映的对象范围的不同: 个体指数:是反映个别现象变动的相对数(个别产品的产量指数、个别商品的价格指数) 总指数:是综合表明全部现象总体数量变动的相对数。(工业产品总产值指数,商品零售量、零售价格总指数) 编制总指数同时,编制组指数和类指数 2、按其所表明的指标性质的不同: 数量指标指数:反映被研究现象总体总规模的变动程度 质量指标指数:说明生产经营所取得效益状态,说明生产工作质量的提高程度。(如产品成本指数、商品价格指数、劳动生产率指数等)
3、指数按采用基期的不同: 定基指数:各个时期指数都是采用同一固定时期为基期计算的指数。 环比指数:是依次以前一期为基期计算的指数。
第二节 综合指数和平均指数 一、综合指数的编制: 1、编制的特点: 第二节 综合指数和平均指数 一、综合指数的编制: 1、编制的特点: 从现象联系关系分析中,来确定与我们所要研究的现象(指数化指标)相联系的因素,从而加入这个因素(同度量因素),使各种商品或产品的不同使用价值量,改变为价值量。 ①、研究各种产品产量变动时,将产量乘以其价格(同度量因素)计算其总产值。 ②、研究各种产品单位成本变动时,将各单位成本乘以其产量(同度量因素)计算其总成本 ③、同指数化指标相联系的同度量因素又叫指数权数,而权数乘以指数化指标的过程也称为加权。
对复杂现象总体所包括的两个因素中的一个因素,即同度量因素或权数加以固定,以便消除其变化,来测定我们所要研究的哪个因素即指数化指标的变动。 ①采用同一时期的价格或单位成本作同度量因素来计算两个时期生产总值或总成本,进行对比,以测定各种产品的产量动态。 ②采用同一时期的产量作同度量因素来计算两个时期生产总值、总成本,进行对比,反映各种产品价格、单位成本的综合变动。
例: 商品名称 计量单位 销售量 价格(元) 基期 报告期 q0 q1 p0 p1 甲 米 1000 1150 100 120 乙 吨 2000 2200 50 70 丙 件 3000 3150 20 35
二、数量指标指数的编制: 1、编制商品销售量个体指数: 动态相对指标
2、编制商品销售量总指数 选择价格作为同度量因素,则:
3、销售量综合指数的编制方法是: 以基期价格分别计算报告期的销售额和基期销售额 进行对比,以销售额的变动来定量表示销售量总指数 4、结论:编制数量指标指数,应以基期质量指标作为同度量因素
三、质量指标指数的编制 1、编制质量指标指数应解决两个问题: 要找出现象总体能够直接相加的同度量因素 要选择同度量因素的所属时期。 2、编制多种商品的销售价格指数,因各种商品使用价值不同,销售价格不能直接相加,即不能同度量。
例: 编制商品价格个体指数 设K代表个体价格指数,则各种商品的个体价格指数为: 计算表明甲、乙、丙三种商品的价格,报告期比基期分别上升20%、40%、75%
编制价格指数:应将各种商品的价格p分别乘以相应的销售量q得销售额pq,再累计相加、对比(销售量成了同度量因素)
3、物价综合指数的编制方法: 以报告期销售量为同度量因素,分别计算报告期和基期销售额 物价总指数的公式 4、结论:编制质量指标指数,应以报告期数量指标作为同度量因素。
四、平均指数编制方法: 1、平均指数是从个体指数出发来编制总指数的,是先计算出各种产品或商品的数量指标或质量指标的个体指数,而后进行加权平均计算,来测定现象的总变动程度。 2、平均指数的计算形式:
调和平均数指数 3、编制数量指标指数多用基期总值加权计算的算术平均数指数。 编制质量指标指数多用报告期总值加权计算的调和平均数指数
第三节 现实中集中经济指数 拉氏公式:将权数固定在基期 注意:决不排除综合指数运用其它时期的权数 平均指数可能独立于综合指数
零售价格指数 公式 零售价格指数分为小类指数、种类指数、大类指数和总指数,分级确定权数,各级权数之和等于100,权数取整数,不用小数。
3、编制过程 计算每一种商品的个体价格指数 根据各商品个体价格指数和响应的权数,计算小类指数。 根据小类价格指数和相应的权数,计算大类指数。 根据中类价格指数和相应的权数,计算大类指数。 根据大类价格指数和相应的权数,计算全社会零售商品价格总指数。
第四节 因素分析 一、因素分析的意义: 1、定义:因素分析就是借助于指数体系来分析社会经济现象变动中各种因素变动发生作用的影响程度。 第四节 因素分析 一、因素分析的意义: 1、定义:因素分析就是借助于指数体系来分析社会经济现象变动中各种因素变动发生作用的影响程度。 2、指标体系有许多能表达为经济方程式,以结果指标为原因指标的函数 生产总值=产量×出厂价格 总成本=产量×单位成本 利税额=销售量×销售价格×利税率 3、这些指标体系,按指数形式表现时,乘积关系依然成立。
分析社会经济现象总体平均指标变动受各种因素变动的影响程度。 4、因素分析主要分析两方面的问题: 分析社会经济现象总体总量指标的变动受各种因素变动的影响程度,它是利用综合指数体系,从数量指标指数和质量指标指数的相互联系中,分析这种现象因素的变动影响关系。 分析社会经济现象总体平均指标变动受各种因素变动的影响程度。
二、因素分析的内容 1、相对数分析:把互相联系的指数组成乘积关系的体系,从指数计算结果本身指出现象总体总量指标或平均指标的变动是由哪些因素变动作用的结果。 2、绝对数分析:是由指数体系中各个指数分子与分母指标之差所形成绝对值上的因果关系,即原因指标指数中分子与分母之差的总和等于结果指标指数分子和分母之差
三、总量指标变动的因素分析: 1、简单现象总体总量指标变动的因素分析: (只有当简单现象总体的总量指标是两个原因指标乘积的函数时,才可据以进行因素分析) 总产值指数=职工人数指数×全员劳动生产率指数
例7解: (P225)
2、复杂现象总体总量指标变动的因素分析: 总量指标两因素分析 例8:
1)、
2)、
3)、
3、总量指标变动多因素分析: 因素分析法中因素排序原则: 先数量因素,后质量因素 先实物量、劳动量因素,后货币量因素 先主要因素、原始因素,后次要因素、派生因素 先代替分子,后代替分母
例9:
其中1)
2)、
3)、
关系:
四、平均指标变动的因素分析 1、平均指标指数体系: 平均指标变动的因素分析需要编制三种平均指标指数:可变构成指数、固定构成指数、结构变动影响指数。 公式:可变指数=固定指数×结构指数
如:
2、平均指标变动因素分析方法
绝对数分析 ① ② ③ ①--表示总平均工资增减的绝对额 ②--表示各组平均工资变动引起总平均工资增减的绝对额 ③--表示各组单位数结构变动引起总平均工资增减的绝对额 代入数字得:-40元=(-240元)+(200元)
由平均指数进一步分析总量指标 要把两期平均指标的差额,乘上报告期的总体单位数加以确定
3、平均指标变动的因素分析实际是平均指标结构变动分析,对现象总体划分为各个“部分”“局部”有两种情况 现象总体按某一重要标志所划分的各个组 现象总体不需分组,而是现实的企事业单位
其中:1)
2)、
第五节 指数数列 一、指数的种类: 1、定义:把各个时期的综合指数,按时间顺序加以排列,就是指数数列,编制指数数列,借以分析研究复杂现象总体在长时间的发展变动趋势。 2、分类: 定基指数数列:各个时期指数,都是采用同一固定时期为基期计算的 环比指数数列:各个时期指数,都是以前一时期为基期计算的指数 3、可变权数:用不同时期的同度量因素 不变权数:用同一时期的同度量因素
4、编制原则: 用基期质量指标为同度量因素的数量指标指数数列
用报告期数量指标为同度量因素的质量指标指数数列
5、例:编制单位成本指数数列: (环比指数)
第九章 动态数列分析 学习要点:本章详细讲述了动态数列的编制方法和分析方法。通过本章的学习,应了解动态数列的概念、种类及编制原则,熟练掌握动态数列的各项分析指标及计算方法,并能结合实际资料进行应用。 §1、动态数列的意义和种类 §2、现象发展的水平指标 §3、现象发展的速度指标 §4、现象变动的趋势分析
§1、动态数列的意义和种类 一、动态数列的意义: 1、动态是指社会经济现象在时间上的发展和运动的过程 2、动态分析就是根据历史资料,应用统计方法来研究社会经济现象数量方面的变化发展过程,认识它的发展规律并预见它的发展趋势。 3、动态数列指社会经济现象在不同时间上的系列指标值按时间先后顺序加以排列后形成的数列,又称时间数列。 动态数列组成:一是反映时间顺序变化的数列,二是反映各个时间下指标值变化的数列。
二、动态数列的种类 按指标表现形式的不同分为总量指标、相对指标、平均指标动态数列 1、总量指标动态数列: 把总量指标在不同时间上的数值按时间先后顺序排列形成总量指标动态数列。 根据总量指标反映社会经济现象性质的不同,又分时期指标、时点指标 时期数列:在总量指标动态数列中,如果每一指标是反映某现象在一段时间发展过程的总量称时期数列
特点: ①、数列具有连续统计的特点 ②、数列中各个指标的数值可以相加 ③、数列中各个指标值大小与所包括时期长短有直接关系。 时点数列:在总量动态数列中,若每一个指标值所反映的是现象在某一时刻上的总量,称时点数列。 特点:①数列不具有连续统计的特点 ②数列中各个指标数值不具有可加性 ③数列中每个指标值的大小与其时间间隔长短没有直接联系。
2、相对指标动态数列:把一系列同类相对指标按时间先后顺序排列而形成的时间数列 3、平均指标动态数列:把一系列平均指标按时间先后顺序排列形成的动态数列 三、编制动态数列的原则: 1、目的:是要通过对数列中各时期指标值的比较,来研究社会经济现象的发展变化及其规律。 2、编制原则: 时间长短应该前后一致 总体范围应该统一 计算方法应该统一 经济内容要统一
§2、现象发展的水平指标 动态分析:现象发展的水平分析、现象发展的速度分析。 水平分析是速度分析的基础,速度分析是水平分析的深入和继续。 一、发展水平 1、定义:是动态数列中的每一项具体指标数值,又称发展量,它反映社会经济现象在各个时期所达到的规模和发展的速度。(可以是总量指标,也可以是相对指标或平均指标)
2、分类: 最初水平—动态数列中第一项指标值,用a0表示 最末水平—动态数列中最后一项指标值,用an表示 报告期水平和基期水平 用符号表示:a0、a1、a2、a3……an 二、平均发展水平 动态平均数(序时平均数):平均发展水平所平均的是现象总体在不同时期上的数量表现,从动态上说明其在某一时期内发展的一般水平。 一般平均数:是将总体各单位同一时间的变量值差异抽象化,用以反映总体在具体历史条件下的一般水平,不体现时间的变动,又称静态平均数。
1、总量指标动态数列计算序时平均数 按时期数列计算: (采用简单算术平均法)
按时点数列计算 ①、以天为间隔的连续时点数列:
②间断时点数列 当时点数列间隔相等,采用“首末折半法”计算:
当时点数列间隔不相等时: 2、相对指标动态数列或平均指标动态数列计算序时平均数
§3、现象发展的速度指标 一、发展速度 1、发展速度是以相对数形式表现的动态分析指标,它是两个不同时期发展水平指标对比的结果。 2、公式:发展速度=报告期水平/基期水平 3、定基发展速度:各报告期水平同某一固定基期水平对比计算。
环比发展速度:报告期水平与前一期水平对比计算
二、增长量 1、增长量是以绝对数形式表示的速度分析指标(称现象发展的绝对速度) 2、公式:增长量=报告期水平-基期水平 3、累积增长量:按固定的基期水平计算的增长量 a1-a0、a2-a0……..an-a0 逐期增长量:以前一期水平为基期计算的增长量
三、增长速度 1、增长速度是反映现象数量增长方向和程度的动态相对指标,由增长量对比基期水平而得 2、公式:
四、平均发展速度和平均增长速度 1、平均发展速度和平均增长速度统称平均速度,是指各个时期环比速度的平均数,说明社会经济现象在较长时期内速度变化的平均速度。 平均发展速度表示现象逐期发展的平均速度 平均增长速度则是反映现象递增的平均速度 2、平均增长速度=平均发展速度-1 平均发展速度总是正值,而平均增长速度可为正值也可为负值
3、计算平均发展速度的方法: 几何平均法:
3)、一段时期的定基发展速度为现象总速度,用R表示 4)、如果现象发展过程为几个时期,又具有各时期平均发展速度,求全过程平均发展速度,
方程式法:又叫代数平均法或累计法,它是以各期发展水平总和与基期水平之比为基础来计算的 因为定基发展速度等于环比发展速度的连乘积 用平均值代替各期环比发展速度: y—定基发展速度
五、速度与水平指标的结合运用 1、要把发展速度和增长速度同隐藏在其后的绝对量——发展水平和增长量结合起来 增长1%的绝对值:是以绝对增长量除以相应的用百分数表现的增长速度,即前期水平的1% 2、要把平均速度指标与动态数列水平指标结合起来
§4、现象变动的趋势分析 一、现象变动趋势分析的意义: 影响动态数列各项发展水平变化的因素 1、长期趋势:指现象在一段较长时间内,由于普遍的、持续的、决定性的基本因素的作用,使发展水平沿着一个方向,逐渐向上或向下变动的趋势。 2、季节变动:指现象受季节的影响而发生的变动,其变动的特点是:在一年或更短的时间内随着时序的更换,使现象呈周期重复的变化。
3、循环变动:指现象发生周期比较长的涨落起伏的变动 4、不规则变动:指现象除了受以上各种变动的影响以外,还受临时的,偶然因素或不明原因而引起的非周期性、非趋势性的随机变动。 现象变动趋势分析就是要把动态数列受各类因素的影响状况分别测定出来,搞清研究对象发展变换的原因及其规律,为预测未来和决策提供依据。
二、长期趋势的测定: 1、定义: 2、测定长期趋势的方法:时距扩大法、移动平均法、数学模型法 时距扩大法:是把原有动态数列中各时期资料加以合并,扩大每段计算所包括的时间,得出较长时距的新动态数列,以消除由于时距较短受偶然因素影响所引起的波动,清楚地显示现象变动的趋势和方向。 移动平均法:是采用逐期递推移动的方法计算一系列扩大时距的序时平均数,并以这一系列移动平均作为对应时期的趋势值。 数学模型法:用适当的数学模型对动态数列配合一个方程式,据以计算各期的趋势值。
三、季节变动的测定 1、目的:在于掌握季节变动的周期、数量界限及其规律,以便预测未来,及时采取措施,克服它对人们经济生活所导致的不良影响,更好地组织生产和销售,提高经济效益和安排好人民生活。 2、主要方法:计算季节比率(按月平均法、趋势剔除法)