3.1回归分析的基本思想及其初步应用(四) 高二数学 选修2-3 第三章 统计案例.

Slides:



Advertisements
Similar presentations
一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
Advertisements

2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
第三节 微分 3.1 、微分的概念 3.2 、微分的计算 3.3 、微分的应用. 一、问题的提出 实例 : 正方形金属薄片受热后面积的改变量.
《解析几何》 -Chapter 3 §7 空间两直线的相关位置.
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
第六章 回归分析.
第十章 相关与回归分析 PowerPoint 统计学.
§1 回归分析.
代数方程总复习 五十四中学 苗 伟.
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
一、二阶行列式的引入 用消元法解二元线性方程组. 一、二阶行列式的引入 用消元法解二元线性方程组.
第三章 函数逼近 — 最佳平方逼近.
Introductory Econometrics for Finance 回归分析的基本概念
10.2 立方根.
《高等数学》(理学) 常数项级数的概念 袁安锋
预测与决策分析 Forecasting and Decision Analysis
1.1.3四种命题的相互关系 高二数学 选修2-1 第一章 常用逻辑用语.
第一章 行列式 第五节 Cramer定理 设含有n 个未知量的n个方程构成的线性方程组为 (Ⅰ) 由未知数的系数组成的n阶行列式
增值评价 2014级 初中起点报告 解读培训 辽宁省基础教育质量监测与评价中心.
量化视角下的豆粕投资机会分析 格林期货研发培训中心 郭坤龙.
工程数学 第22讲 本文件可从网址 上下载 (单击ppt讲义后选择'工程数学'子目录)
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
不确定度的传递与合成 间接测量结果不确定度的评估
第四节 一阶线性微分方程 线性微分方程 伯努利方程 小结、作业 1/17.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
初中数学 九年级(下册) 5.3 用待定系数法确定二次函数表达式.
第十章 回归分析预测法 第一节 相关分析 第二节 一元线性回归预测法 第三节 多元线性回归预测法 第四节 非线性回归预测法.
曲线拟合 Curve fitting 2002级研究生《医学统计学》.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
第12章 回归直线.
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
数学实验之 回归分析(1).
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
用函数观点看方程(组)与不等式 14.3 第 1 课时 一次函数与一元一次方程.
第十章 方差分析.
2.1.2 指数函数及其性质.
高等数学 西华大学应用数学系朱雯.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
若2002年我国国民生产总值为 亿元,如果 ,那么经过多少年国民生产总值 每年平均增长 是2002年时的2倍? 解:设经过 年国民生产总值为2002年时的2倍, 根据题意有 , 即.
第一章 函数与极限.
人教版五年级数学上册第四单元 解方程(一) 马郎小学 陈伟.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
6.4不等式的解法举例(1) 2019年4月17日星期三.
9.1 简单线性相关分析 9.2 一元线性回归分析 9.3 多元线性回归与复相关分析 9.4 变量间非线性关系的回归
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
从浩瀚无垠的宇宙到微小的分子、原子,从无机界到有机界,从自然到社会,无一事物不处在与其他事物的联系之中
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
函数的连续性.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
一元二次不等式解法(1).
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
高中数学选修 导数的计算.
概率论与数理统计B.
2.3.运用公式法 1 —平方差公式.
第三节 函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.
回归分析实验课程 (实验三) 多项式回归和定性变量的处理.
多元线性回归分析.
*第十节 最小二乘法 第九章 问题的提出: 已知一组实验数据 求它们的近似函数关系 y=f (x) . 需要解决两个问题:
三角 三角 三角 函数 余弦函数的图象和性质.
数学模型实验课(二) 最小二乘法与直线拟合.
3.3.2 两点间的距离 山东省临沂第一中学.
§3.1.2 两条直线平行与垂直的判定 l1 // l2 l1 ⊥ l2 k1与k2 满足什么关系?
Presentation transcript:

3.1回归分析的基本思想及其初步应用(四) 高二数学 选修2-3 第三章 统计案例

比《数学3》中“回归”增加的内容 选修2-3——统计案例 数学3——统计 引入线性回归模型 y=bx+a+e 画散点图 了解相关指数 R2 和模型拟合的效果之间的关系 了解残差图的作用 利用线性回归模型解决一类非线性回归问题 正确理解分析方法与结果 数学3——统计 画散点图 了解最小二乘法的思想 求回归直线方程 y=bx+a 用回归直线方程解决应用问题

复习回顾 1、线性回归模型: y=bx+a+e, (3) y=bx+a+e, 其中a和b为模型的未知参数,e称为随机误差。 E(e)=0,D(e)= (4) 2、数据点和它在回归直线上相应位置的差异 是随机误差的效应,称 为残差。 3、对每名女大学生计算这个差异,然后分别将所得的值平方后加起来,用数学符号表示为: 称为残差平方和,它代表了随机误差的效应。

R2 1,说明回归方程拟合的越好;R20,说明回归方程拟合的越差。 4、两个指标: (1)类比样本方差估计总体方差的思想,可以用作 为 的估计量, 越小,预报精度越高。 (2)我们可以用相关指数R2来刻画回归的效果,其 计算公式是: R2 1,说明回归方程拟合的越好;R20,说明回归方程拟合的越差。

5、残差分析与残差图的定义: 在研究两个变量间的关系时,首先要根据散点图来粗略判断它们是否线性相关,是否可以用回归模型来拟合数据。 然后,我们可以通过残差 来判断模型拟合的效果,判断原始数据中是否存在可疑数据,这方面的分析工作称为残差分析。 我们可以利用图形来分析残差特性,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图。

案例2 一只红铃虫的产卵数y和温度x有关。现收集了7组观测数据列于表中: 非线性回归问题 案例2 一只红铃虫的产卵数y和温度x有关。现收集了7组观测数据列于表中: 温度xoC 21 23 25 27 29 32 35 产卵数y/个 7 11 24 66 115 325 (1)试建立产卵数y与温度x之间的回归方程;并预测温度为28oC时产卵数目。 (2)你所建立的模型中温度在多大程度上解释了产卵数的变化?

一元线性模型 探索新知 方案1 解:选取气温为解释变量x,产卵数 为预报变量y。 选变量 画散点图 选 模 型 50 100 150 200 250 300 350 3 6 9 12 15 18 21 24 27 30 33 36 39 解:选取气温为解释变量x,产卵数 为预报变量y。 选变量 画散点图 选 模 型 假设线性回归方程为 :ŷ=bx+a 估计参数 由计算器得:线性回归方程为y=19.87x-463.73 相关指数R2=r2≈0.8642=0.7464 分析和预测 当x=28时,y =19.87×28-463.73≈ 93 所以,二次函数模型中温度解释了74.64%的产卵数变化。

93>66 ? 模型不好? 奇怪?

二次函数模型 合作探究 方案2 选用y=bx2+a ,还是y=bx2+cx+a ? 如何求a、b ? y=bx2+a 变换 y=bt+a 问题1 选用y=bx2+a ,还是y=bx2+cx+a ? 问题2 如何求a、b ? 问题3 y=bx2+a 变换 y=bt+a 非线性关系 线性关系 t=x2 产卵数 气温

方案2解答 平方变换:令t=x2,产卵数y和温度x之间二次函数模型y=bx2+a就转化为产卵数y和温度的平方t之间线性回归模型y=bt+a 21 23 25 27 29 32 35 温度的平方t 441 529 625 729 841 1024 1225 产卵数y/个 7 11 24 66 115 325 作散点图,并由计算器得:y和t之间的线性回归方程为y=0.367t-202.543,相关指数R2=0.802 将t=x2代入线性回归方程得: y=0.367x2 -202.543 当x=28时,y=0.367×282-202.54≈85,且R2=0.802, 所以,二次函数模型中温度解 释了80.2%的产卵数变化。 t

合作探究 指数函数模型 方案3 产卵数 气温 问题1 如何选取指数函数的底? 问题2 变换 y=bx+a 非线性关系 线性关系 对数

方案3解答 令 ,则 就转换为z=bx+a. 对数变换:在 中两边取常用对数得 由计算器得:z关于x的线性回归方程 为 对数变换:在 中两边取常用对数得 令 ,则 就转换为z=bx+a. 温度xoC 21 23 25 27 29 32 35 z=lny 1.946 2.398 3.045 3.178 4.190 4.745 5.784 产卵数y/个 7 11 24 66 115 325 由计算器得:z关于x的线性回归方程 为 x z 相关指数R2=0.98 当x=28oC 时,y ≈44 ,指数回归模型中温度解释了98.5%的产卵数的变化

最好的模型是哪个? 产卵数 气温 产卵数 气温 线性模型 二次函数模型 指数函数模型

最好的模型是哪个? 比一比 函数模型 相关指数R2 线性回归模型 0.7464 二次函数模型 0.80 指数函数模型 0.98

回归分析(二) 由计算可得: 则回归方程的残差计算公式分别为: 因此模型(1)的拟合效果远远优于模型(2)。 x 21 23 25 27 29 32 35 y 7 11 24 66 115 325 0.557 -0.101 1.875 -8.950 9.230 -13.381 34.675 47.696 19.400 -5.832 -41.000 -40.104 -58.265 77.968 因此模型(1)的拟合效果远远优于模型(2)。

总 结 对于给定的样本点 两个含有未知参数的模型: 其中a和b都是未知参数。拟合效果比较的步骤为: (1)分别建立对应于两个模型的回归方程 总 结 对于给定的样本点 两个含有未知参数的模型: 其中a和b都是未知参数。拟合效果比较的步骤为: (1)分别建立对应于两个模型的回归方程 与 其中 和 分别是参数a和b的估计值; (2)分别计算两个回归方程的残差平方和 与 (3)若 则 的效果比 的好;反之, 的效果不如 的好。

练习:为了研究某种细菌随时间x变化,繁殖的个数,收集数据如下: 1 2 3 4 5 6 繁殖个数y/个 12 25 49 95 190 (1)用天数作解释变量,繁殖个数作预报变量,作出这些 数据的散点图; (2) 描述解释变量与预报变量 之间的关系; (3) 计算残差、相关指数R2. 天数 繁殖个数 解:(1)散点图如右所示

(2)由散点图看出样本点分布在一条指数函数y= 的周围,于是令Z=lny,则 x 1 2 3 4 5 6 Z 1.79 2.48 3.22 3.89 4.55 5.25 由计数器算得 则有 (3) 6.06 12.09 24.09 48.04 95.77 190.9 y 6 12 25 49 95 190 即解释变量天数对预报变量繁殖细菌得个数解释了99.99%.

练习 假设关于某设备的使用年限x和所支出的维修费用 y(万元),有如下的统计资料。 2 3 4 5 6 维修费用y 2.2 3.8 5.5 6.5 7.0 若由资料知,y对x呈线性相关关系。试求: (1)线性回归方程 的回归系数 ; (2)求残差平方和; (3)求相关系数 ; (4)估计使用年限为10年时,维修费用是多少?

解: (1)由已知数据制成表格。 1 2 3 4 5 合计 6 20 2.2 3.8 5.5 6.5 7.0 25 4.4 11.4 22.0 32.5 42.0 112.3 9 16 36 90 所以有