第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验

Slides:



Advertisements
Similar presentations
第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
Advertisements

一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
第6章 多重共线性的情形及其处理 6 .1 多重共线性产生的背景和原因 6 .2 多重共线性对回归模型的影响 6 .3 多重共线性的诊断
第六章 回归分析.
生 物 统 计 学 第7章 回归与相关 彭司华 2016年5月.
5 多元线性回归分析 §1 一元线性回归分析 §2 多元线性回归分析 §3 最优回归方程的选取 §4 可线性化的非线性回归.
第三章 经典单方程计量经济学模型:多元线性回归模型
第六章 样本及抽样分布 简单随机抽样: 代表性: 中每一个与所考察的总 体有相同的分布。 2.独立性: 是相互独立的随机变量。
第十章 相关与回归分析 PowerPoint 统计学.
回归分析法预测 (Regression Analysis)
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
第三章 函数逼近 — 最佳平方逼近.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
多元回归分析:推断 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论 刘愿.
完全随机设计多样本资料秩和检验.
第 8 章 假设检验 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
第5章 自变量的选择与逐步回归 5.1 自变量选择对估计和预测的影响 5.2 所有子集回归 5.3 逐步回归 5.4 本章小结与评注.
第六章 假设检验的基本概念.
第二章 经典单方程计量经济学模型: 一元线性回归模型
量化视角下的豆粕投资机会分析 格林期货研发培训中心 郭坤龙.
工程数学 第22讲 本文件可从网址 上下载 (单击ppt讲义后选择'工程数学'子目录)
田间试验和统计方法 第九章 直线回归与相关.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
计量经济学 第三章 多元线性回归模型.
第15章 相关分析与回归分析 (续).
第一节 引言 第二节 一元线性回归模型 第三节 多元线性回归模型 第四节 虚拟变量回归模型 第五节 非线性回归模型 本章小节 主要内容.
区间估计 Interval Estimation.
统计学期末复习
简单回归模型 过原点回归 简单回归模型的定义 普通最小二乘法的推导 OLS的操作技巧 度量单位和函数形式 OLS估计量的期望值和方差
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
§3.3 多元线性回归模型的统计检验 一、拟合优度检验 二、方程的显著性检验(F检验) 三、变量的显著性检验(t检验) 四、参数的置信区间.
计量经济学 第三章 多元线性回归模型.
第二章 回归模型 法、参数的普通最小二乘估计式及相关性质、对模型的经济意 义检验和统计检验,能应用Eviews软件进行最小二乘估计与统
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
数学实验之 回归分析(1).
第六章 相关与回归分析 学习目的和要求 学习重点 学习难点 教学方法 授课时数 基本内容.
第九章 方差分析和回归分析 单因素方差分析 一元线性回归 回归诊断.
第4章 多元线性回归分析.
第2章 一元线性回归分析 §2.1 :回归分析及回归模型 §2.2 :一元线性模型的参数估计 §2.3 :参数估计值的性质及统计推断
回归分析.
多元回归分析:估计 y = b0 + b1x1 + b2x bkxk + u 计量经济学导论 刘愿.
第十章 方差分析.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
第七章 参数估计 7.3 参数的区间估计.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
9.1 简单线性相关分析 9.2 一元线性回归分析 9.3 多元线性回归与复相关分析 9.4 变量间非线性关系的回归
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
§8.1 方差分析 Analysis of Variance-ANOVA
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第三章 两变量线性回归.
第四章 多元线性回归分析.
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第八章 假设检验 8.3 两个正态总体参数的假设检验.
参数估计 参数估计问题:知道随机变量(总体)的分布类型, 但确切的形式不知道,根据样本来估计总体的参数,这 类问题称为参数估计。
多元线性回归分析.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
数学模型实验课(二) 最小二乘法与直线拟合.
Presentation transcript:

第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验 第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验 2 .5 残差分析 2 .6 回归系数的区间估计 2 .7 预测和控制 2 .8 本章小结与评注

例2 .1 表2.1列出了15起火灾事故的损失及火灾发生地与最近的消防站的距离。 2 .1 一元线性回归模型 例2 .1 表2.1列出了15起火灾事故的损失及火灾发生地与最近的消防站的距离。 表2.1 火灾损失表

例2.2 全国人均消费金额记作y(元); 人均国民收入记为x(元) 2 .1 一元线性回归模型 例2.2 全国人均消费金额记作y(元); 人均国民收入记为x(元) 表2.2 人均国民收入表

2 .1 一元线性回归模型

2 .1 一元线性回归模型 一元线性回归模型 此时回归方程为

2 .1 一元线性回归模型 样本观测值(x1,y1),(x2,y2),…,(xn,yn) 样本模型 回归方程 经验回归方程

一、普通最小二乘估计 (Ordinary Least Square Estimation,简记为OLSE) 2 .2 参数β0、β1的估计 一、普通最小二乘估计 (Ordinary Least Square Estimation,简记为OLSE) 最小二乘法就是寻找参数β0、β1的估计值使离差平方和达极小 称为yi的回归拟合值,简称回归值或拟合值 称为yi的残差

2 .2 参数β0、β1的估计

2 .2 参数β0、β1的估计 经整理后,得正规方程组

2 .2 参数β0、β1的估计 得OLSE 为 记

2 .2 参数 的估计 续例2.1 回归方程

2 .2 参数 的估计 似然函数 二、最大似然估计 连续型:是样本的联合密度函数: 离散型:是样本的联合概率函数。 2 .2 参数 的估计 二、最大似然估计 连续型:是样本的联合密度函数: 离散型:是样本的联合概率函数。 似然函数并不局限于独立同分布的样本。 似然函数 在假设εi~N(0,σ2)时,由(2.10)式知yi服从如下正态分布:

2 .2 参数β0、β1的估计 二、最大似然估计 y1,y2,…,yn 的似然函数为: 对数似然 函数为: 与最小二乘原理完全相同

2 .3 最小二乘估计的性质 一、线性 是y1,y2,…,yn 的线性函数 :

2 .3 最小二乘估计的性质 二、无偏性 其中用到

2 .3 最小二乘估计的性质 三、 的方差

2 .3 最小二乘估计的性质 三、 的方差 在正态假设下 GaussMarkov条件

2.4 回归方程的显著性检验 一、t 检验 原假设: H0 :β1=0 对立假设: H1 :β1≠0 由 当原假设H0 :β1=0成立时有:

2.4 回归方程的显著性检验 一、t 检验 构造t 统计量 其中

2.4 回归方程的显著性检验 二、用统计软件计算 1.例2.1 用Excel软件计算

什么是P 值? (P-value) P 值即显著性概率值 Significence Probability Value 是当原假设为真时得到比目前的 样本更极端的样本的 概率,所谓极端就是与原假设相背离 它是用此样本拒绝原假设所犯弃真错误的 真实概率,被称为观察到的(或实测的)显著性水平

双侧检验的P 值 t / 2 / 2 拒绝 拒绝 H0值 临界值 临界值 计算出的样本统计量 计算出的样本统计量 1/2 P 值

左侧检验的P 值 抽样分布 a 置信水平 拒绝域 1 -  样本统计量 H0值 临界值 计算出的样本统计量 P 值 Rejection region does NOT include critical value. a 1 -  P 值 H0值 样本统计量 临界值 计算出的样本统计量

右侧检验的P 值 抽样分布 a 置信水平 拒绝域 1 -  H0值 临界值 计算出的样本统计量 P 值 Rejection region does NOT include critical value. a 1 -  P 值 H0值 临界值 计算出的样本统计量

利用 P 值进行检验的决策准则 若p-值 ≥ ,不能拒绝 H0 若p-值 < , 拒绝 H0 双侧检验p-值 =2×单侧检验p-值

2.4 回归方程的显著性检验 二、用统计软件计算 2. 例2.1用SPSS软件计算

2.4 回归方程的显著性检验 二、用统计软件计算 2.用SPSS软件计算

2.4 回归方程的显著性检验 三、F检验 平方和分解式 SST = SSR + SSE 构造F检验统计量

2.4 回归方程的显著性检验 方差来源 自由度 平方和 均方 F值 P值 回归 残差 总和 1 n-2 n-1 SSR SSE SST 一元线性回归方差分析表 方差来源 自由度 平方和 均方 F值 P值 回归 残差 总和 1 n-2 n-1 SSR SSE SST SSR/1 SSE/(n-2) P(F>F值) =P值

2.4 回归方程的显著性检验 四、相关系数的显著性检验

2.4 回归方程的显著性检验 四、相关系数的显著性检验

2.4 回归方程的显著性检验 四、相关系数的显著性检验 附表1 相关系数ρ=0的临界值表 n-2 5% 1% 1 0.997 1.000 附表1 相关系数ρ=0的临界值表 n-2 5% 1% 1 0.997 1.000 16 0.468 0.590 35 0.325 0.418 2 0.950 0.990 17 0.456 0.575 40 0.304 0.393 3 0.878 0.959 18 0.444 0.561 45 0.288 0.372 4 0.811 0.947 19 0.433 0.549 50 0.273 0.354 5 0.754 0.874 20 0.423 0.537 60 0.250 6 0.707 0.834 21 0.413 0.526 70 0.232 0.302 7 0.666 0.798 22 0.404 0.515 80 0.217 0.283 8 0.632 0.765 23 0.396 0.505 90 0.205 0.267 9 0.602 0.735 24 0.388 0.496 100 0.195 0.254 10 0.576 0.708 25 0.381 0.487 125 0.174 0.228 11 0.553 0.684 26 0.374 0.478 150 0.159 0.208 12 0.532 0.661 27 0.367 0.470 200 0.138 0.181 13 0.514 0.641 28 0.361 0.463 300 0.113 0.148 14 0.497 0.623 29 0.355 400 0.098 0.128 15 0.482 0.606 30 0.349 0.449 1000 0.062 0.081

2.4 回归方程的显著性检验 四、相关系数的显著性检验 用SPSS软件做相关系数的显著性检验

2.4 回归方程的显著性检验 两变量间相关程度的强弱分为以下几个等级: 当|r|≥0.8时,视为高度相关; 四、相关系数的显著性检验 两变量间相关程度的强弱分为以下几个等级: 当|r|≥0.8时,视为高度相关; 当0.5≤|r|< 0.8时,视为中度相关; 当0.3≤|r|< 0.5时,视为低度相关; 当|r|< 0.3时,表明两个变量之间的相关程度极弱, 在实际应用中可视为不相关。

2.4 回归方程的显著性检验 五、三种检验的关系 H0: b=0 H0: r=0 H0: 回归无效

2.4 回归方程的显著性检验 六、样本决定系数 可以证明

2.5 残差分析 一、残差概念与残差图 残差 误差项 残差ei是误差项ei的估计值。

2.5 残差分析 一、残差概念与残差图

2.5 残差分析 一、残差概念与残差图 图 2.6 火灾损失数据残差图

2.5 残差分析 二、残差的性质 性质1 E (ei)=0 证明:

2.5 残差分析 二、残差的性质 性质2 其中 称为杠杆值

2.5 残差分析 二、残差的性质

2.5 残差分析 二、残差的性质 性质3. 残差满足约束条件:

2.5 残差分析 三、改进的残差 标准化残差 学生化残差

2.6 回归系数的区间估计 等价于 β1的1-α 置信区间

2.7 预测和控制 一、单值预测

2.7 预测和控制 二、区间预测 1.因变量新值的区间预测 找一个区间(T1,T2),使得 需要首先求出其估计值 的分布

二、区间预测 1. 因变量新值的区间预测 以下计算 的方差 从而得

二、区间预测 1. 因变量新值的区间预测 记 则 于是有

二、区间预测 1. 因变量新值的区间预测 y0的置信概率为1-α的置信区间为 y0的置信度为95%的置信区间近似为

二、区间预测 1. 因变量新值的区间预测 E(y0)=β0+β1x0是常数 得E(y0)的1-α的置信区间为

二、区间预测 计算 对例2.1的火灾损失数据,假设保险公司希望预测一个距最近的消防队x0=3.5公里的居民住宅失火的损失 点估计值 95%区间估计 单个新值: (22.32,32.67) 平均值E(y0):(26.19,28.80) 的95%的近似置信区间为 =(27.50-2×2.316,27.50+2×2.316) =(22.87,32.13)

二、控制问题 给定y的预期范围(T1, T2),如何控制自变量x的值 才能以1-α的概率保证 把 带入

一、一元线性回归模型从建模到应用的全过程 例2.2 全国人均消费金额记作y(元); 人均国民收入记为x(元) 2.8 本章小结与评注 一、一元线性回归模型从建模到应用的全过程 例2.2 全国人均消费金额记作y(元); 人均国民收入记为x(元) 表2.2 人均国民收入表

2.8 本章小结与评注 二、有关回归假设检验问题 1973年Anscombe构造了四组数据, 这四组数据所建的回归方程是相同的,决定系数,F统计量也都相同,且均通过显著性检验。

2.8 本章小结与评注