第2章一元线性回归 2 .1 一元线性回归模型 2 .2 参数的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验

第2章一元线性回归 2 .1 一元线性回归模型 2 .2 参数的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
第2章一元线性回归 2 .1 一元线性回归模型 2 .2 参数的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验 2 .5 残差分析 2 .6 回归系数的区间估计 2 .7 预测和控制 2 .8 本章小结与评注

例2 .1 表2.1列出了15起火灾事故的损失及火灾发生地与最近的消防站的距离。
2 .1 一元线性回归模型例2 .1 表2.1列出了15起火灾事故的损失及火灾发生地与最近的消防站的距离。表2.1 火灾损失表

例2.2 全国人均消费金额记作y(元); 人均国民收入记为x(元)
2 .1 一元线性回归模型例2.2 全国人均消费金额记作y(元); 人均国民收入记为x(元) 表人均国民收入表

2 .1 一元线性回归模型

2 .1 一元线性回归模型一元线性回归模型此时回归方程为

2 .1 一元线性回归模型样本观测值(x1，y1),(x2，y2),…,(xn，yn) 样本模型回归方程经验回归方程

一、普通最小二乘估计 (Ordinary Least Square Estimation,简记为OLSE)
2 .2 参数β0、β1的估计一、普通最小二乘估计 (Ordinary Least Square Estimation,简记为OLSE) 最小二乘法就是寻找参数β0、β1的估计值使离差平方和达极小称为yi的回归拟合值,简称回归值或拟合值称为yi的残差

2 .2 参数β0、β1的估计

2 .2 参数β0、β1的估计经整理后,得正规方程组

2 .2 参数β0、β1的估计得OLSE 为记

2 .2 参数的估计续例2.1 回归方程

2 .2 参数的估计似然函数二、最大似然估计连续型：是样本的联合密度函数：离散型：是样本的联合概率函数。
2 .2 参数的估计二、最大似然估计连续型：是样本的联合密度函数：离散型：是样本的联合概率函数。似然函数并不局限于独立同分布的样本。似然函数在假设εi～N(0,σ2)时,由（2.10）式知yi服从如下正态分布:

2 .2 参数β0、β1的估计二、最大似然估计 y1,y2,…,yn 的似然函数为：对数似然函数为：与最小二乘原理完全相同

2 .3 最小二乘估计的性质一、线性是y1,y2,…,yn 的线性函数：

2 .3 最小二乘估计的性质二、无偏性其中用到

2 .3 最小二乘估计的性质三、的方差

2 .3 最小二乘估计的性质三、的方差在正态假设下 GaussMarkov条件

2.4 回归方程的显著性检验一、t 检验原假设： H0 ：β1=0 对立假设： H1 ：β1≠0 由当原假设H0 ：β1=0成立时有：

2.4 回归方程的显著性检验一、t 检验构造t 统计量其中

2.4 回归方程的显著性检验二、用统计软件计算 1．例2.1 用Excel软件计算

什么是P 值? (P-value) P 值即显著性概率值 Significence Probability Value
是当原假设为真时得到比目前的样本更极端的样本的概率，所谓极端就是与原假设相背离它是用此样本拒绝原假设所犯弃真错误的真实概率，被称为观察到的(或实测的)显著性水平

双侧检验的P 值 t / 2 / 2 拒绝拒绝 H0值临界值临界值计算出的样本统计量计算出的样本统计量 1/2 P 值

左侧检验的P 值抽样分布 a 置信水平拒绝域 1 -  样本统计量 H0值临界值计算出的样本统计量 P 值
Rejection region does NOT include critical value. a 1 -  P 值 H0值样本统计量临界值计算出的样本统计量

右侧检验的P 值抽样分布 a 置信水平拒绝域 1 -  H0值临界值计算出的样本统计量 P 值
Rejection region does NOT include critical value. a 1 -  P 值 H0值临界值计算出的样本统计量

利用 P 值进行检验的决策准则若p-值 ≥ ,不能拒绝 H0 若p-值＜ , 拒绝 H0 双侧检验p-值 =2×单侧检验p-值

2.4 回归方程的显著性检验二、用统计软件计算 2. 例2.1用SPSS软件计算

2.4 回归方程的显著性检验二、用统计软件计算 2.用SPSS软件计算

2.4 回归方程的显著性检验三、F检验平方和分解式 SST = SSR + SSE 构造F检验统计量

2.4 回归方程的显著性检验方差来源自由度平方和均方 F值 P值回归残差总和 1 n-2 n-1 SSR SSE SST
一元线性回归方差分析表方差来源自由度平方和均方 F值 P值回归残差总和 1 n-2 n-1 SSR SSE SST SSR/1 SSE/（n-2） P(F>F值) =P值

2.4 回归方程的显著性检验四、相关系数的显著性检验

2.4 回归方程的显著性检验四、相关系数的显著性检验附表1 相关系数ρ=0的临界值表 n-2 5% 1% 1 0.997 1.000
附表1 相关系数ρ=0的临界值表 n-2 5% 1% 1 0.997 1.000 16 0.468 0.590 35 0.325 0.418 2 0.950 0.990 17 0.456 0.575 40 0.304 0.393 3 0.878 0.959 18 0.444 0.561 45 0.288 0.372 4 0.811 0.947 19 0.433 0.549 50 0.273 0.354 5 0.754 0.874 20 0.423 0.537 60 0.250 6 0.707 0.834 21 0.413 0.526 70 0.232 0.302 7 0.666 0.798 22 0.404 0.515 80 0.217 0.283 8 0.632 0.765 23 0.396 0.505 90 0.205 0.267 9 0.602 0.735 24 0.388 0.496 100 0.195 0.254 10 0.576 0.708 25 0.381 0.487 125 0.174 0.228 11 0.553 0.684 26 0.374 0.478 150 0.159 0.208 12 0.532 0.661 27 0.367 0.470 200 0.138 0.181 13 0.514 0.641 28 0.361 0.463 300 0.113 0.148 14 0.497 0.623 29 0.355 400 0.098 0.128 15 0.482 0.606 30 0.349 0.449 1000 0.062 0.081

2.4 回归方程的显著性检验四、相关系数的显著性检验用SPSS软件做相关系数的显著性检验

2.4 回归方程的显著性检验两变量间相关程度的强弱分为以下几个等级：当|r|≥0.8时，视为高度相关；
四、相关系数的显著性检验两变量间相关程度的强弱分为以下几个等级：当|r|≥0.8时，视为高度相关；当0.5≤|r|＜ 0.8时，视为中度相关；当0.3≤|r|＜ 0.5时，视为低度相关；当|r|＜ 0.3时，表明两个变量之间的相关程度极弱，在实际应用中可视为不相关。

2.4 回归方程的显著性检验五、三种检验的关系 H0: b=0 H0: r=0 H0: 回归无效

2.4 回归方程的显著性检验六、样本决定系数可以证明

2.5 残差分析一、残差概念与残差图残差误差项残差ei是误差项ei的估计值。

2.5 残差分析一、残差概念与残差图

2.5 残差分析一、残差概念与残差图图 2.6 火灾损失数据残差图

2.5 残差分析二、残差的性质性质1 E (ei)=0 证明:

2.5 残差分析二、残差的性质性质2 其中称为杠杆值

2.5 残差分析二、残差的性质

2.5 残差分析二、残差的性质性质3. 残差满足约束条件:

2.5 残差分析三、改进的残差标准化残差学生化残差

2.6 回归系数的区间估计等价于 β1的1-α 置信区间

2.7 预测和控制一、单值预测

2.7 预测和控制二、区间预测 1．因变量新值的区间预测找一个区间（T1,T2），使得需要首先求出其估计值的分布

二、区间预测 1. 因变量新值的区间预测以下计算的方差从而得

二、区间预测 1. 因变量新值的区间预测记则于是有

二、区间预测 1. 因变量新值的区间预测 y0的置信概率为1-α的置信区间为 y0的置信度为95%的置信区间近似为

二、区间预测 1. 因变量新值的区间预测 E(y0)=β0+β1x0是常数得E(y0)的1-α的置信区间为

二、区间预测计算对例2.1的火灾损失数据，假设保险公司希望预测一个距最近的消防队x0=3.5公里的居民住宅失火的损失点估计值
95%区间估计单个新值：（22.32，32.67）平均值E(y0)：（26.19，28.80）的95%的近似置信区间为 =（ ×2.316， ×2.316） =（22.87，32.13）

二、控制问题给定y的预期范围(T1, T2),如何控制自变量x的值才能以1-α的概率保证
把带入

一、一元线性回归模型从建模到应用的全过程例2.2 全国人均消费金额记作y(元); 人均国民收入记为x(元)
2.8 本章小结与评注一、一元线性回归模型从建模到应用的全过程例2.2 全国人均消费金额记作y(元); 人均国民收入记为x(元) 表人均国民收入表

2.8 本章小结与评注二、有关回归假设检验问题 1973年Anscombe构造了四组数据, 这四组数据所建的回归方程是相同的,决定系数,F统计量也都相同,且均通过显著性检验。

2.8 本章小结与评注

第2章一元线性回归 2 .1 一元线性回归模型 2 .2 参数的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验

Similar presentations

Presentation on theme: "第2章一元线性回归 2 .1 一元线性回归模型 2 .2 参数的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验"— Presentation transcript:

Similar presentations

About project

反馈

请登录

Auth with social network:

第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验

Similar presentations

Presentation on theme: "第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验"— Presentation transcript:

Similar presentations

About project

反馈

第2章一元线性回归 2 .1 一元线性回归模型 2 .2 参数的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验

Presentation on theme: "第2章一元线性回归 2 .1 一元线性回归模型 2 .2 参数的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验"— Presentation transcript: