导入新课 在《数学3》中,我们对两个具有线性相关关系的变量利用回归分析的方法进行了研究,其步骤为: 画散点图 求回归直线方程

Slides:



Advertisements
Similar presentations
浦江二中 钱咏梅. 垂体 甲状腺 胸腺 肾上腺 胰岛 卵巢(女性) 睾丸(男性) 人体主要的内分泌腺 性腺性腺 }
Advertisements

版 画 制 作版 画 制 作 版 画 种 类版 画 种 类 版 画 作 品版 画 作 品 刘承川.
统计与可能性总复习 第六单元 统计与可能性 一 、 1 )抛一枚硬币,有( )可能, 分别是( )和( )。出 现正面的可能性是( )。 2 ) 某人抛硬币连续 5 次都正面朝上, 那么第 6 次抛硬币正面朝上的可能性 ( ),如果抛 60 次,正面朝上 可能是( )次,反面朝上是( ) 次。 两种.
吉林大学护理学院儿科护理教研室 主讲教师 刘晓丹 教授. 吉林大学护理学院儿科护理教研室 第一节 生长发育概述 一、生长发育规律 一、生长发育规律 二、生长发育的影响因素 二、生长发育的影响因素 第二节 生长发育评估 一、体格生长发育评估 一、体格生长发育评估 二、神经心理发育评估 二、神经心理发育评估.
人体在生命活动过程中需要能量, 能量主要来源于食物。 他们健康吗? 人体内能量的平衡与调节 奉城二中 徐玉.
大象報告 製作:周泓宇圖片:姚勝騰、柯俊安資料:林岑祐. 大象的食物 大象吃青草、樹皮、樹葉等多種不同的食 物。大象用長鼻攀折樹枝、把樹連根拔起, 還把另一些樹的樹皮剝光,讓樹木枯萎。 大象就這樣把森林變為開闊的林地,使燎 原野火易於發生,終於把那個地帶變為無 樹平原。大象喜愛有樹的地方。從前大象.
50912 吳明杰 獅子. 公獅經常在晨曦和傍晚時分吼叫,主要是宣示主 權。獅子是貓科動物中唯一的群居品種,獅群捕 獵:獅子狩獵時會集體行動,牠們常用的方式是 幾頭獅子先在有利的地方埋伏,另一頭獅子則公 然追趕獵物,目的是把獵物驅趕往埋伏好的獅子 附近。獅子喜歡在晚間狩獵,這樣可以提高成功 率。 公獅.
嬰幼兒的發展與保育. 嬰幼兒外觀的發展 一、身高體重 1. 出生 6 個月內的嬰兒每個月增加 0.5-1kg 2. 1 歲時約 10kg 3. 1 歲比出生時的身高約多了 50% , 4 歲時達出生時身長的 2 倍 4. 一般而言, 食用母奶的嬰兒較配方奶的嬰兒發展 較為緩慢 5. 身高體重低於 25%
( 1 )用秤可以称出物体的( )。 ( 2 )表示物体有多重,可以用( )和 ( )作单位,物体较轻时用( ),物体 较重时用( )。 “ 克 ” 用 “g” 表示; “ 千克 ” 用 “kg” 表示. 质量 克 千克 克 ( 3 ) 1 千克 = ( )克 5000 克 = ( )千克 1 千克.
第十章 滑菇栽培技术 通过本章学习,要了解滑菇生物 学特性,目前生产情况和栽培形 式,掌握滑菇生产中的主要技术 环节,能够独立进行栽培生产。
大学物理实验 第一讲 南昌大学物理实验中心 2013年2月.
得獎作品.
第五章 主张超尘绝俗的 佛家.
中国医科大学法医学院血清学教研室 刘利民 教授
狗的種類 作者:麥澤洋.
自我介紹 班級:運促一甲 學號:D 姓名:張晉輔.
腹有诗书气自华 邓 兵 2014年6月12日.
古代四大美女de风云 沉鱼 . 西施 落雁 . 王昭君 闭月 . 貂禅 羞花 . 杨玉环 编者:周惠婷,李雪蓉
自傳 82410陳信宏.
歷史建築清水國小宿舍群修復工程 施工說明會
青春花季 拒绝香烟 12机电大专(1)班 主题班会.
2000年7月5日 星期三 口语 复习课 教务处公开示范课 制作、授课:郑艳群.
第三章 生产活动与地域联系 第二节 工业区位.
北师大版六年级数学下册 正比例和反比列 太和县第二小学 任迪慧.
第二课 扬起自信的风帆 我能“行”.
一、银行保证金质押 二、理财产品质押 三、银行卡被盗刷的责任问题 四、票据纠纷
活力 射 四 简报 种子发芽咯 de 国培(2015)小学数学四组 3/11/2017.
白酒生产工艺 项目三 酒曲生产技术.
愛錢又搞笑的日本警察 兩津勘吉.
通榆县养殖技术培训班 中国肉牛选育及杂种优势利用 张国梁 国家肉牛牦牛产业技术体系 2015年8月27日.
田径运动.
第五章 餐饮食品原料采购管理.
青铜器的器型 炊食器: 炊具:鼎、鬲、甗等 食器:豆、簋、敦、盨、簠等 酒器: 饮酒器:爵、角、觚、觯等 温酒器:斝
生命之托 重于泰山 张芳芳.
第三大單元 犬隻之飼養與管理 1.犬隻選擇 2.犬的繁殖 3.幼犬的飼養與管理 4.成犬的飼養與管理.
烟草栽培学 南平农校 杨志和.
牛品种介绍及繁殖技术 张金山 研究员 新疆畜牧科学院畜牧研究所 二0一三年三月.
第十章 树脂类中药.
走进哆啦A梦的生活.
第一讲 食用菌的营养价值和药用价值.
保育员职业技能鉴定.
预备年级体育理论 肥胖与消瘦的危害.
第四节 重积分的应用 一、平面区域的面积 二、立体体积 三、曲面的面积 四、物体的质量 五、物体的质心 六、物体的转动惯量 七、物体的引力
拒绝危险驾驶  安全文明出行 2015全国交通安全日专题课件.
《现代汉语语法研究》第三讲 现代汉语语法的句法分析.
早在公元5世纪的北魏古籍中,就有关于腐乳生产工艺的记载“于豆腐加盐成熟后为腐乳”。
第四节 统计初步和数据整理 在这一节中我们将介绍统计学的基本知识。统计学是一门古老而又年轻的学科,例如为了征兵和收税的早期的人口统计,甚至在公元前就出现了。但是近代数理统计学,却主要是从20世纪初开始发展的。其主要特征是运用概率论的知识进行统计推断。即从所研究的全部对象中抽取部分个体,并通过对这部分个体的观察和分析,对全部对象的有关问题作出推断。数理统计学已经建立了一套系统的理论,有着广泛的应用。下面先介绍统计学中最基本的概念。
歡迎來認識黃金獵犬 黃金獵犬的神祕小世界.
2.3 变量间的相关关系 变量之间的相关关系 两个变量的线性相关 第二课时.
军队院校和国防生 报考指南 (第 一 讲).
“食品公司”.
江苏省大丰市农广校.
蔬菜生产技术 茭白栽培.
健康體位講座 如何增進健康體適能 演講者:張書軒 老師 96.09.28.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
棠外附小三年级数学下册 口算大王比赛 请你在10秒钟内做好准备!.
萬有引力 =一種令兩個或以上物體互相吸引的力量。 →地心吸力,令人們有「重量」感 →星體引力,令星體之間維持平衡,保持一定距離
自我介紹 大同國中 湯晴雯.
个 人 简 历 R e s u m e 2019/4/12.
職災案例 指導教師:楊慶章 學 生:許承霖、吳鎮廷、孔張孔 大仁科技大學環境與職業安全衛生系
线性代数电子课件 西安石油大学理学院 工程数学教研室制作.
第一单元 四则运算 乘、除法的定义及各部分间的关系 北京市东城区府学胡同小学 吴建成.
第 四 章 迴歸分析應注意之事項.
两个变量的线性相关 琼海市嘉积中学 梅小青.
小学数学第一册 10的认识 锦山小学 高婧媛.
家禽生产与疾病防治 任务一 肉鸡品种的选择 家禽生产与疾病防治 课程组 2019年5月24日1时52分.
危险化学品事故调查实例系列讲座③ 鞭炮厂大爆炸 侦破记 赵铸新 主讲
线性回归.
第八章 服務部門成本分攤.
习惯跑步 徐凤林 北京大学哲学系 2019年5月29日.
Presentation transcript:

导入新课 在《数学3》中,我们对两个具有线性相关关系的变量利用回归分析的方法进行了研究,其步骤为: 画散点图 求回归直线方程 用直线方程进行预报

提问:“名师出高徒”这句彦语的意思是什么?有名气的老师就一定能教出厉害的学生吗?这两者之间是否有关? 函数关系是一种确定性关系,而相关关系是一种非确定性关系.那么,这节课我们就学习对具有相关关系的两个变量进行统计分析的一种常用方法——回归分析.

1.1回归分析的基本思想 及 其初步应用

教学目标 知识目标 通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.   通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.   了解回归模型和函数模型的区别.任何模型只能近似描述实际问题.   了解残差分析和指标R2的含义.

能力目标 具有初步应用回归分析的能力. 情感目标 通过对回归分析的基本思想的学习,能够在现实生活中应用此思想.

教学重难点 重 点 难 点 (1)了解线性回归模型与函数模型的差异; (2)了解判断刻画模型拟合效果的方法-相关指数和残差分析. 重 点 (1)了解线性回归模型与函数模型的差异; (2)了解判断刻画模型拟合效果的方法-相关指数和残差分析. 难 点 解释残差变量的含义,了解偏差平方和分解的思想.

探究 对于一组具有线性相关关系的数据 (x1,y1),(x2,y2),…,(xn,yn), 我们知道回归直线y=bx+a的斜率和截距的最小二乘估计分别为

其中 称为样本点的中心,你能推导出这两个计算公式吗? 回归直线过样本点的中心

从已经学过的知识我们知道,截距 和斜率 分别是使 取最小时 的值.由于

继续

继续

在上式中,后两项和 无关,而前两项为非负数,因此要使Q取得最小值,当且仅当前两项的值均为0,即有 这正是我们所要推导的公式.

例题1 从某大学中随机选取8名女大学生,其身高和体重数据如下表所示: 编 号 1 2 3 4 5 6 7 8 身高/cm 165 157 编 号  1  2  3  4  5  6  7  8 身高/cm 165 157 170 175 155 体重/kg 48 57 50 54 64 61 43 59 求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重.

解答 第一步:画散点图

探究 第二步:求回归方程 计算器得: 故线性回归方程: 身高为172cm的女大学生的体重一定是60.316kg吗?如果不是,其原因是什么? 第三步:代值计算 当x=172时,

显然,身高172cm的女大学生的体重不一定是60. 316kg,但一般可以认为她的体重在60 显然,身高172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重在60.316kg左右,下图中的样本点和回归直线的相互位置说明了这一点.

由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身高和体重的关系可用线性回归模型 y=bx+a+e 来表示,这里a和b为模型的未知参数,e是y与bx+a之间的误差.通常e为随机变量,称为随机误差.它的均值E(e)=0,方差D(e)=2>0,这样线性回归的完整表达式为 y=bx+a+e E(e)=0, D(e)=2.

注意 存在误差的原因 (1)随机误差,其大小取决于随机误差的方差. 在线性回归模型中,随机误差e的方差 2越小 ,用bx+a预报真实值y的精度越高. (2) 和 为斜率和截距的估计值,它们与真实值a和b之间也存在误差.

探究 在线性回归模型中,e是用bx+a预报真实值y的随机误差,它是一个不可观测的量,那么应该怎样研究随机误差呢? 在实际应用中,我们用回归方程 中的 估计bx+a. 由于随机误差e=y-(bx+a),所以 是e的估计值. 对于样本点 (x1,y1),(x2,y2),…,(xn,yn)

而言,它们的随机误差为 ei=yi-bxi-a,i=1,2,…,n, 其估计值为 称为相应于点(xi,yi)的残差(residual).

思考   如何发现数据中的错误?如何衡量模型的拟合效果? (1)可以利用残差图来分析残差特性; (2)可以利用. 来刻画回归的效果.

作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图. 1 2 3 4 5 6 7 10 20 30 40 50 60 70 80 -10 -20 -30 -40 -50 -60 90 100 残差图 作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.

对R2的理解 (1)在含有一个解释变量的线性模型中, R2恰好等于相关系数r的平方. (2)对于已经获取的样本数据, R2表达式中的 为确定的数. 因此R2越大,意味着残差平方和 越小,即模型的拟合效果越好;反之,越差.

用身高预报体重时,需要注意以下问题 (1)回归方程只适用于我们所研究的样本总体; (2)我们所建立的回归方程一般都有时间性; (3)样本取值的范围会影响回归方程的适用范围; (4)不能期望回归方程得到的预报值就是预报变量的精确值.

建立回归模型的基本步骤: (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; (2)画出解释变量和预报变量的散点图,观察它们之间的关系; (3)由经验确定回归方程的类型; (4)按一定规则估计回归方程中的参数; (5)得出结果后分析残差图是否有异常,若有异常,检查数据是否有误,或模型是否合适等.

例题2 关于X与Y有如下数据: x 2 4 5 6 8 y 30 40 60 50 70 为了对x、Y两个变量进行统计分析,现有以下两种线性模型 和 试比较哪一个模型拟合的效果更好.

解答 分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论. 84.5%>82%,所以甲选用的模型拟合效果较好.

课堂小结 1.数学知识 2. 数学思想 3.数学方法 (1)建立回归模型及残差图分析的基本步骤; (2)不同模型拟合效果的比较方法;   1.数学知识 (1)建立回归模型及残差图分析的基本步骤; (2)不同模型拟合效果的比较方法; (3)相关指数和残差的分析.   2. 数学思想 数形结合的思想,化归思想及整体思想.   3.数学方法 数形结合法,转化法,换元法.

高考链接 1. (2007年浙江)某校有学生2000人,其中高三学生500人,为了了解学生身体素质情况,采用按年级分层抽样的方法,从该学生中抽取一个200人的样本,则样本中高三学生的人数为_________. 解析:本题考查抽样的方法. 由已知抽样比200/2000=1/10,故样本中高三学生数为500*(1/10)=50.

2.(2007年广东)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据. 3 4 5 6 y 2.5 4.5 (1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程

(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? 解析: (1)如下图

故线性回归方程为y=0.7x+0.35. (3)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7×100+0.35=70.35.

课堂练习 1.选择 (1)下列说法中正确的有:( ) C ①若r>0,则x增大时,y也相应增大; (1)下列说法中正确的有:( ) ①若r>0,则x增大时,y也相应增大; ②若r<0,则x增大时,y也相应增大; ③若r=1或r=-1,则x与y的关系完全对应(由函数关系),在散点图上各个点均在一条直线上 A. ① ② B. ② ③ C. ① ③ D. ① ② ③ C

解析: 若r>0,表示两个相关变量正相关,x增大时,y也相应增大,故①正确. r<0,表示两个变量负相关,x增大时,y也相应减小,故②错误. |r|越接近1,表示两个变量相关性越高,|r|=1表示两个变量有确定的关系(即函数关系),故③正确.

(2)对两个变量y与x进行回归分析,分别选择不同的模型,它们的相关系数r如下,其中拟合效果最好的模型是( ) A.模型Ⅰ的相关系数r为0.98 B.模型Ⅱ的相关系数r为0.80 C.模型Ⅲ的相关系数r为0.50 D.模型Ⅳ的相关系数r为0.25 A 解析:根据相关系数的定义和计算公式可知,|r|≦1,且|r|越接近于1,相关程度越大,拟合效果越好;|r|越接近于0,相关程度越小,拟合效果越弱.

(3)对有线性相关关系的两个变量建立的回归直线方程 中,回归系数 ( ) A.可以小于0 B.小于0 C.能等于0 D.只能等于0 A 解析: 时,得r=0,这时不具有线性相关性,但 能大于0,也能小于0.

2.解答题 (1)现随机抽取了我校10名学生在入学考试中的数学成绩(x)与入学后的第一次考试中的数学成绩(y),数据如下: 学生号 1 2 3 4 5 6 7 8 9 10 x 120 108 117 104 103 110 105 99 y 84 64 68 69 46 57 71 试问这10个学生的两次数学考试成绩是否具有显著性线性相关关系?

解答 易得 则相关系数为 查表得自由度为10-2=8相应的相关关系临界值 由 知,两次数学考试成绩有显著性的线性相关关系.

(2)观察两相关量得如下数据: x -1 -2 -3 -4 -5 5 3 4 2 1 y -9 -7 7 9 求两变量间的回归方程.

解答 列表: i 1 2 3 4 5 6 7 8 9 10 xi -1 -2 -3 -4 -5 yi -9 -7 xiyi 14 15 12

所求回归直线方程为

习题解答 1. 画散点图的目的是通过变量的散点图判断两个变量更近似于什么样的函数关系,以确定是否直接用线性回归模型来拟合原始数据. 2. 分析残差可以帮助我们解决以下几个问题: (1)寻找异常点,就是残差特别大的点,考察相应的样本数据是否有错; (2)分析残差图可以发现模型选择是否合适. 3.(1)解释变量和预报变量的关系是线性函数关系; (2)R2=1.