预测与决策分析 Forecasting and Decision Analysis 陈振 河南农业大学信息与管理科学学院 管理科学系 13683807788,hnchenzhen@eyou.com
回归分析预测法 任何现象都有其产生的原因,任何原因都会引起一定结果。这是一般事物运动的规律。 因果预测:所预测的对象同与之有关的因素联系起来分析,找出因果关系户模型,然后根据模型预测。 回归分析预测法属于因果预测。
“回归”的涵义 英国生物学家兼统计学家高尔登(F. Galton)和他的学生皮尔森(K. Pearson) 在研究人体身高的遗问题时发现这样一个现象:高个子父母的子女身高往往低于其父母,而矮个子父母的子女身高却往往高于其父母。从整体上高个子人、矮个子人身高都在回归于人类的平均身高。 后来,“回归”一词就为生物学家与统计学沿用。 一般说来,回归是指研究自变量与因变量之间的关系形式的分析方法。回归预测的目的在于根据已知自变量来估计因变量的总平均值。
相关分析与回归分析 变量之间的因素关系可分为两类:一类是函数关系;二是相关关系或统计关系。 函数关系:对自变量每一个数值,因变量都有一个确定的值与之相对应,并且这种关系能用数学表述或反映出来。函数关系反映着现象之间存在着严格的依存关系。 相关关系:相关关反映着现象之间存在着非严格的、不确定的依存关系。这种依存关系有两个显著特点:现象之间确实存在着数量上的客观内在关系;现象之间数量依存关系不确定,具一定的随机性。 相关分析与回归分析。回归分析与相关分析均为研究及测度两个或两个以上变量之间关系的方法。相关分析是研究两个或两个以上随机变量之间相互依存关系的紧密程度。 回归分析是研究某一随机变量(因变量)与其它一个或几个普通变量(自变量)之间的数量变动关系。由回归分析求出的关系,称为回归模型。 两种分析的区别是:相关分析研究的都有是随机变量,并且不分自变量与因变量。回归分析研究的变量的自变量和因变量之分,自变量是确定的普通变量,因变量是随机变量。
回归模型的种类 根据回归模型自变量的多少,回归模型可分为一元回归模型和多元回归模型。一元回归模型描述的是一个因变量与一个自变量之间的相关关系。多元回归模型描述的是一个因变量与两个或两个以上自变量之间的相关关系。 根据回归模型自变量是否线性,回归模型可分为线性和非线性回归模型。在线性回归模型中,因变量与自变量之间呈线性关系。在非线性回归模型中,因变量与自变量之间呈非线性关系。 根据回归模型是否带虚拟变量,回归模型可分为普通回归模型和带虚拟变量回归模型。虚拟变量回归模型的自变量既有数量变量又有品质变量。如农作物产品不仅受施肥、降雨量、气温等数量影响,而且也受地势和政府政策等品质变量的影响。 根据回归模型是否用滞后的因变量作自变量,回归模型又可分为自回归模型与无自回归现象的回归模型。
回归分析预测的基本问题 变量间相关关系的定性分析 变量因果关系的确定 数学模型的选择 回归方程与回归系数的显著性检验
一元回归分析预测 一元回归预测也称单因素预测。 一元回归预测一般可分为一元线性回归预测和一元曲线回归预测两类,前者是最简单的形式。
一元线性回归分析预测 回归方程的建立 参数估计 模型显著性检验 利用回归方程进行预测
一元线性回去归方程的模型
一元线性回去归方程的模型
参数估计 线性回归模型参数的估计方法通常有两种:普通最小二乘法;最大似然估计法。 最常用的是普通最小二乘法。 最小二乘法的中心思想,是通过数学模型,配合一条较为理想的趋势线。这条趋势线必须满足下列两点要求:①原数列的观测值与模型估计值的离差平方和为最小;②原数列的观测值与模型估计值的离差总和为0。
参数估计
参数估计
参数估计
模型显著性检验
相关系数检验:
t 检验
F 检验
德宾—沃森检验(D_W检验)
德宾—沃森检验(D_W检验)
德宾—沃森检验(D_W检验)
产生自相关的原因及补救办法。
利用回归方程进行预测
一元线性回归预测举例
一元线性回归预测举例
一元线性回归预测举例
一元线性回归预测举例
一元线性回归预测举例
一元曲线回归预测 在许多实实际际问题中大量存在着非线性关系,对这类问题只有选择适当的曲线来拟合,才会符合实际情况,也就是说回归方程应是曲线方程,这类问题称为曲线回归。 有些曲线回归方程经过恰当的代换后,可以化为线性回归方程,对这类回归方程,一般是先将其化为线性回归,用最小二乘法求出参数的估计值,再通过适当的变换得到曲线回归方程参数的估计值。
一元曲线回归预测的步骤 利用原变量所提供的数据绘绘制散点图,与基本函数图形对照,再根据实践经验,确定选配的曲线类型,写出表达式。 通过适当的变量代换将曲线直线化。 按直线回归计算其回归参数。 还原,写出曲线回归的具体表达式。 曲线回归方程的效果检验。 根据回归方程进行预测。
一元曲线模型线性化
一元曲线模型线性化
一元曲线模型线性化
多元回归预测 多元回归模型描述的是一个因变量与两个或两个以上自变量之间的相关关系。 多元回归,也叫多重回归。 多元回归可分为多元线性回归与多元曲线回归两类。 多元回归预测的原理与一元回归预测模型的原理基本相同,但计算过程要复杂一些。
多元线性回归预测 多元线性回归因素分析 多元线性回归模型的建立 多元线性回归模型的检验 利用回归方程进行预测
多元线性回归因素分析
因素选择的方法
相关消元法
多重共线性问题 在多元回归预测中,要求各影响因素之间相互独立 。 在多元线性回归预测中,若各自变量之间也存在线性相关关系,称为多重共线性问题。 解决多重共线性问题的方法:(1)删除自变量;(2)改变自变量;(3)自变量不采用绝对量形式,而改作年增长率可减少共线性问题。
多元线性回归模型的建立
多元线性回归模型的建立
回归参数向量估计
多元线性回归模型的检验 多元线性回归方程的检验,主要有如下几项: F检验主要是检验整个回归方程的回归显著性可靠性。 t检验主要是通过t统计量检验所求回归模型的每一个系数的显著性。 复相关系数是对多个自变量对自变量的相关程度的综合度量。 多重可决系数测定拟合程度。 精度检验 :(1)整体精度 ;(2)回归系数的精度
F 检验
t 检验
复相关系数检验
拟合程度的测定
精度检验
利用回归方程进行预测
多元线性回归预测举例
多元线性回归预测举例
多元线性回归预测举例
多元线性回归预测举例
多元线性回归预测举例
多元线性回归预测的主要工作过程
多元曲线回归预测
多元曲线回归问题化多元线性回归问题