概 率 统 计 主讲教师 叶宏 山东大学数学院.

Slides:



Advertisements
Similar presentations
南 通. 南通概述 南通,位于江苏省东部, 东抵黄海,南望长江。 “ 据江 海之会、扼南北之喉 ” ,隔江 与中国经济最发达的上海及 苏南地区相依,被誉为 “ 北上 海 ” 。 南通也是中国首批对 外开放的 14 个沿海城市之一 ,被称为 “ 中国近代第一城 ” 。 南通面临海外和内陆两大经 济辐射扇面,素有.
Advertisements

1 天天 5 蔬果 國立彰化特殊教育學校 延杰股份有限公司營養師:陳婷貽. 2 蔬果彩虹 579 蔬果彩虹 歲以內兒童,每天 攝取五份新鮮蔬菜水 果,其中應有三份蔬 菜兩份水果 蔬菜份數水果份數總份數 兒童 325 女性 437 男性 549.
高等学校英语应用能力考试 考务培训 兰州文理学院教务处 2014 年 12 月. 考务培训 21 日请监考人员上午 8:00 (下午 2:30 )到综合楼 205 教室集合,查看 监考安排,由考务负责人进行考务 培训。
語言與文化通識報告 - 台日年菜差異 - 指導老師 : 葉蓁蓁 小組 : 日本微旅行 組員 :4a21b032 吳采玲 4a21b037 沈立揚 4a 洪雅芳 4a 陳楚貽 4a 王巧稜.
投資權證13問 交易所宣導資料(104) 1.以大盤指數為標的之權證,和大盤指數的連動性,為什麼比和期交所期指的連動性差?
第一章 人口与环境 第一节 人口增长模式.
窦娥冤 关汉卿 感天动地 元·关汉卿.
天津1班面试专项练习1 综合分析现象类 主讲:凌宇 时间:5月21日 19:00—22:00.
这是一个数字的 乐园 这里埋藏着丰富的 宝藏 请跟我一起走进数学的 殿堂.
第五章 主张超尘绝俗的 佛家.
45天备考指南 2013年下半年国考资格证笔试系列讲座(2) 华图教师事业部 石杨平.
行政公文 纪 要 讲授人: 安学珍 铜仁职业技术学院.
二代健保補充保費 代扣項目說明 簡報.
第4课 “千古一帝”秦始皇.
南京师范大学数学科学院 涂荣豹 中 国 数 学 教 学 的 继 承 与 发 展 南京师范大学数学科学院 涂荣豹
知其不可而为之.
一、平面点集 定义: x、y ---自变量,u ---因变量. 点集 E ---定义域, --- 值域.
中国画家协会理事、安徽省美术家协会会员、 工艺美术师、黄山市邮协常务理事余承平主讲
第二课 扬起自信的风帆 我能“行”.
班級老師:潘盈仁 班級:休閒三甲 學號:4A0B0124 學生:柯又瑄
第二章 语音 第六节 音变 轻 声1.
2014政法干警备考平台 2014政法干警考试群⑨ 中公教育政法干警考试 ——微博 中公教育政法干警考试
腐败的食物表面有白色小圆斑点,绿色斑点等
管理学基本知识.
教師專業發展評鑑(一) 實施計畫與規準討論
资料分析 如何攻破最后瓶颈 主讲老师:姚 剑 4月6日20:00 YY频道:
汉字的构造.
诵读欣赏 古代诗词三首.
第四章 借贷记账法的应用.
第五章 主要经济业务核算 第一节 筹集资金的核算 第二节 供应过程的核算 第三节 生产过程的核算 第四节 销售过程的核算
清仓处理 跳楼价 满200返160 5折酬宾.
滁州学院首届微课程教学设计竞赛 课程名称:高等数学 主讲人:胡贝贝 数学与金融学院.
试卷 20 14安徽 13全国卷 大纲卷 13山东卷 13浙江卷 2013上海卷 13海 南 卷 13江苏卷 题号 30 32
昆明心桥心理健康研究所 心理健康工作者 钱锡安 讲座预约 个案咨询预约
成本会计 主讲教师:钟小玲 讲师 硕士 主讲教师:钟小玲 讲师 硕士 办公电话: 手机:
1.1.2 四 种 命 题.
上节主要内容回顾 借贷记账法的主要内容: 总分类账户与明细分类账户的平行登记 记账规则 试算平衡 要点:内容相同、方向一致、金额相等
高三地理专题复习 地方时和区时 解题技巧.
第四节 统计初步和数据整理 在这一节中我们将介绍统计学的基本知识。统计学是一门古老而又年轻的学科,例如为了征兵和收税的早期的人口统计,甚至在公元前就出现了。但是近代数理统计学,却主要是从20世纪初开始发展的。其主要特征是运用概率论的知识进行统计推断。即从所研究的全部对象中抽取部分个体,并通过对这部分个体的观察和分析,对全部对象的有关问题作出推断。数理统计学已经建立了一套系统的理论,有着广泛的应用。下面先介绍统计学中最基本的概念。
09学前教育班 魏文珍 自我介绍.
世上孩子都是宝, 男孩女孩都一样。.
拾貳、 教育行政 一、教育行政的意義 教育行政,可視為國家對教育事務的管理 ,以增進教育效果。 教育行政,乃是一利用有限資源在教育參
课标教材下教研工作的 实践与思考 山东临沂市教育科学研究中心 郭允远.
房产税纳税申报---全部自用 全部自用 问:该企业应纳多少房产税?每月应纳多少房产税? 案例1(全部自用)
課程銜接 九年一貫暫行綱要( )  九年一貫課程綱要( ) 國立台南大學數學教育系 謝 堅.
第八章二元一次方程组 8.3实际问题与二元一次方程组.
2.3 变量间的相关关系 变量之间的相关关系 两个变量的线性相关 第二课时.
第八章二元一次方程组 8.3实际问题与二元一次方程组 (第3课时).
邂逅“行程”——行程问题 四年级 数学 周凯.
2.4 二元一次方程组的应用(1).
贴近教学 服务师生 方便老师.
六年级 语文 下册 第四单元 指尖的世界.
(浙教版)四年级品德与社会下册 共同生活的世界 第四单元 世界之窗 第二课时.
第十四章 数理统计方法 §14.1 数理统计的基本概念 §14.2 参数的点估计 §14.3 区间估计 §14.4 回归分析 返回.
全方位自主學習平台- 教師評鑑平台 操作說明
第四单元:可能性 掷一掷 武汉市洪山区教育科学研究培训中心 李桂玲.
第三节 实对称矩阵的对角化 一、方阵对角化的条件 二、实对称矩阵的对角化 三、小结与思考 2019/4/6.
票據與生活.
海水运动→→洋流 你知道吗 在十年前,日本的科学家曾经做过一个有趣的实验:在日本以东的洋面拨撒了大量的带有颜色的物质。
成 本 会 计 学 第七章 产品成本计算的辅助方法.
在山的那边 ——作者: 张家新 —— 小时候,我常伏在窗口痴想 ——山那边是什么呢? 妈妈告诉我:海 哦,山那边是海吗?
山清水秀的林芝 yy 曾元一
第 四 章 迴歸分析應注意之事項.
两个变量的线性相关 琼海市嘉积中学 梅小青.
Xián 伯 牙 绝 弦 安徽淮南市八公山区第二小学 陈燕朵.
数学题解答 第二章 一元一次方程 2.1从算式到方程 (第1课时) 数学题解答
6上 5 小數除法(二) 9.有A、B兩袋金幣,金幣的數量相同。 的金幣全部是真的,共重 。 中有一些金幣是假的,共重 。 A袋
线性回归.
第 1 章 單一預測變數線性迴歸.
用加減消去法解一元二次聯立方程式 台北縣立中山國中 第二團隊.
Presentation transcript:

概 率 统 计 主讲教师 叶宏 山东大学数学院

回归分析是描述数据处理方法的一门应用学科,是统计学者常用的工具,本章对回归分析的基础知识和应用作简单介绍。 第7章 回归分析和方差分析 回归分析是描述数据处理方法的一门应用学科,是统计学者常用的工具,本章对回归分析的基础知识和应用作简单介绍。

7.1 一元线性回归 变量之间的关系大致可分为两大类: 1.确定性的关系:可以用精确的函数关系来表达。例如矩形面积S与边长a,b的关系。 7.1 一元线性回归 变量之间的关系大致可分为两大类: 1.确定性的关系:可以用精确的函数关系来表达。例如矩形面积S与边长a,b的关系。 2.非确定性的关系:变量之间既互相联系但又不是完全确定的关系,称为相关关系。例如人的身高与体重、农作物产量与降雨量等的关系。

从数量的角度去研究这种非确定性的关系,是数理统计的一个任务 从数量的角度去研究这种非确定性的关系,是数理统计的一个任务. 包括通过观察和试验数据去判断变量之间有无关系,对其关系大小作数量上的估计、推断和预测,等等. 回归分析就是研究相关关系的一种重要的数理统计方法.

一、一元正态线性回归模型 只有两个变量的回归分析, 称为一元回归分析; 超过两个变量时称为多元回归分析. 变量之间成线性关系时, 称为线性回归, 变量间不具有线性关系时, 称为非线性回归.

设随机变量Y,对于x的每一个值, Y 均有自己的分布 设随机变量Y,对于x的每一个值, Y 均有自己的分布 .若EY 存在,则它一定是x的函数,记为 u(x),其值可通过样本进行估计,对于x的一组值xi (i=1,…,n),作独立试验,对Y 得出n个观测结果yi (i=1,…,n) ,即有n次独立观察, 得样本观测值: (x1,y1) , (x2,y2) ,… , (xn,yn) 我们要解决的问题是:如何利用这些样本观测值来估计u(x).当然,首先要推测其形式,一般可以作出散点图,从中可粗略看出 y与x的关系.

y = a + b x +ε 若y和x之间大体上呈现线性关系, 可假定 其中a 和 b是未知常数, ε表示其它随机因素的影响. 通常假定ε服从正态分布N(0,σ2), 即 其中 为未知参数.

称(2)为 y 关于 x 的一元线性回归方程 . 称 y = a + b x +ε, ε ~N(0,σ2 ) (1) 为一元线性回归模型. 由(1)得 E(y)=a+bx 用E(y)作为y 的估计 得 称(2)为 y 关于 x 的一元线性回归方程 .

(x1,y1) ,… , (xn,yn) (3) 模型(1)中的变量x , y进行n次独立观察, 得样本观测值: 由此样本得方程组: 这里εi 是第 i 次观察时的随机误差,它是不可观察的随机变量.

由于各次观察独立,故有 (4)式和(5)式结合,给出了样本(x1,y1),…,(xn,yn) 的概率性质. 它是对理论模型进行统计分析推断的依据. 也常称(4)+(5)为一元线性回归模型.即

由于方程(6)的建立依赖于通过观察或试验取得的数据, 故又称其为经验回归方程或经验公式. 回归分析的任务是利用n组独立观察数据(x1,y1),…,(xn,yn)来估计a和b, 以估计值 和 分别代替(2)式中的a和b, 得回归方程 由于方程(6)的建立依赖于通过观察或试验取得的数据, 故又称其为经验回归方程或经验公式. 称为未知参数 a,b 的回归系数. 问题:如何利用n组独立观察数据来估计a和b?

二、最小二乘法估计 首先举例说明最小二乘法的思想: 假设为了估计某物体的重量, 对它进行了n次称量, 因称量有误差, 故n次称量结果x1, x2,…,xn有差异, 现在用数 去估计该物体的重量, 则它与上述n次称量结果的偏差的平方和为:

寻找一个使上述平方和达到最小的 ,作为这个物体重量的估计值, 这种方法称为最小二乘法. 最小二乘法认为, 一个好的估计 , 应使这个平方和尽可能地小. 估计原则: 寻找一个使上述平方和达到最小的 ,作为这个物体重量的估计值, 这种方法称为最小二乘法. 用这种方法作出的估计叫最小二乘估计.

对(x,y)作n次观察(试验),得到n对数据,要求找一条直线 ,尽可能好地拟合这些数据. 由回归方程,当x取值xi时, 应取值a+bxi , 而实际观察到的为yi ,这样就形成了偏差

依照最小二乘法的思想,提出目标量Q(a,b) (7) 它是所有实测值yi与回归值 的偏差平方和.

设法求出a , b的估计值 , ,使偏差平方和 Q(a,b)达到最小. y x

由此得到的回归直线 是在所有直线中偏差平方和Q(a,b)最小的一条直线. y x

通常可采用微积分中求极值的办法, 求出使Q(a,b)达到最小的 , . 令:

得 称上式为正规方程组.

由于 改写正规方程组得

因为xi 不全相同,故系数行列式不为0,即 由此解得方程组有唯一解

(8) 其中

也可用下面的等价式子: 其中

可以证明,用最小二乘法求出的估计 分别是 a, b 的无偏估计, 即 它们都是 y1,y2, …,yn的线性函数,而且在所有y1, y2 , …,yn的线性函数中, 最小二乘估计的方差最小.

由于 是从观察值得到的回归方程,它会随观察结果的不同而改变,并且它只反映了由 x 的变化引起的 y 的变化,并没有包含误差项 (1) 的点估计是什么? (2) 回归方程是否有意义? 即自变量 x 的变化是否真的对因变量 y 有影响? 因此有必要对回归效果作出检验. (3) 如果方程真有意义,用它预测 y 时,预测值与真值的偏差能否估计? 下面讨论这这些问题。

三、 的点估计 称 为 xi 处的残差 称 为残差平方和.

反映了除 x 外其它因素对 y 的影响, 这些因素没有反映在自变量x中, 它们可作为随机因素看待. 可以证明 因此

是 的无偏估计.

四.线性假设的显著性检验(T 检验法) 检验问题

成立时取检验统计量

给定显著性水平 的拒绝域为

这里第三项为0,第二项为残差平方和,第一项为回归平方和. 五.线性回归的方差分析(F 检验法) 平方和分解公式 这里第三项为0,第二项为残差平方和,第一项为回归平方和.

对检验问题 设显著性水平 取检验统计量 则拒绝域

六.利用回归方程进行预报(预测) 1.点预报 对给定的 x = x0 ,利用回归方程 可以作出Y的点预报值

2.区间预报 设 x = x0 时,Y 的观测值 y0 点预报值 易证