第二部分:统计推断 Chp6:统计推断概述 Chp7:非参数推断 Chp8:Bootstrap Chp9:参数推断 Chp10:假设检验

Slides:



Advertisements
Similar presentations
第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
Advertisements

一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
Chp11:贝叶斯推断 内容: 贝叶斯观点和贝叶斯方法 贝叶斯推断 vs. 频率推断.
07/16/96 概率统计 自考辅导.
第六章 样本及抽样分布 简单随机抽样: 代表性: 中每一个与所考察的总 体有相同的分布。 2.独立性: 是相互独立的随机变量。
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
一、能线性化的多元非线性回归 二、多元多项式回归(线性化)
第三章 函数逼近 — 最佳平方逼近.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
本讲义可在网址 或 ftp://math.shekou.com 下载
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
余角、补角.
区间估计 Interval Estimation.
统计学期末复习
Introduction To Mean Shift
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
第二章 回归模型 法、参数的普通最小二乘估计式及相关性质、对模型的经济意 义检验和统计检验,能应用Eviews软件进行最小二乘估计与统
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
数学实验之 回归分析(1).
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
计算机数学基础 主讲老师: 邓辉文.
EM算法 一种参数估计的方法.
第十章 方差分析.
第七章 参数估计 7.3 参数的区间估计.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
Chp9:参数推断 主要内容 参数推断的基本概念 参数推断的方法 矩方法
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
复习.
第七章 参数估计 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
第二部分:统计推断 Chp6:统计推断概述 Chp7:非参数推断 Chp8:Bootstrap Chp9:参数推断 Chp10:假设检验
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第三章 两变量线性回归.
第四章 多元线性回归分析.
第四章 常用概率分布 韩国君 教授.
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
数据统计与分析 秦 猛 南京大学物理系 第11讲 办公室:唐仲英楼A
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
§2 方阵的特征值与特征向量.
第二节 简单线性回归模型的最小二乘估计 用样本去估计总体回归函数,总要使用特定的方法,而任何估 计参数的方法都需要有一定的前提条件——假定条件 一、简单线性回归的基本假定 为什么要作基本假定? ●只有具备一定的假定条件,所作出的估计才具有良好的统计性质。 ●模型中有随机扰动项,估计的参数是随机变量,显然参数估计值的分布与扰动项的分布有关,只有对随机扰动的分布作出假定,才能比较方便地确定所估计参数的分布性质,也才可能进行假设检验和区间估计等统计推断。
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
本节课内容 MLE的性质 MLE很流行是因为MLE有一些很好的性质.
第十四章 假设检验 (Hypothesis Testing)
参数估计 参数估计问题:知道随机变量(总体)的分布类型, 但确切的形式不知道,根据样本来估计总体的参数,这 类问题称为参数估计。
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
贝叶斯估计 Bayes Estimation
三角 三角 三角 函数 余弦函数的图象和性质.
Presentation transcript:

第二部分:统计推断 Chp6:统计推断概述 Chp7:非参数推断 Chp8:Bootstrap Chp9:参数推断 Chp10:假设检验

Chp6:统计推断 统计推断/学习 统计推断的基本问题: 利用数据来推断产生数据的分布的过程 我们观测到数据 ,要推断(估计或学习)F 或 F 的某些性质(如均值和方差)。 概率 数据产生过程 观测到的数据 统计推断

推断的基本问题 推断的基本问题 点估计 置信区间 假设检验

统计推断概述 统计模型 模型估计 估计的评价 参数模型 非参数模型 点估计 区间估计 假设检验 无偏性 一致性 有效性 … 第三部分的统计学习部分更多地关心模型选择

参数模型 参数模型 当 为向量,而我们只对其中一部分参数感兴趣,则其余参数称为冗余参量(nuisance parameters ) 可用有限个参数参数化,如 也可记为 一般形式 当 为向量,而我们只对其中一部分参数感兴趣,则其余参数称为冗余参量(nuisance parameters )

非参数模型 非参数模型 粗略地说,非参数模型不能用有限个参数参数化 如

例:参数推断 6.1例(一维参数估计)设 是独立的Bernoulli(p)观测,问题在于如何估计参数p。 6.2例(二维参数估计)假设 且PDF , 如 则有两个参数 。 目标是从数据中获得参数。如果仅对μ感兴趣,那么μ是感兴趣参数,而 σ 是冗余参量。

例:非参数推断 6.3例(CDF的非参数估计)设 是来自CDF F 的独立观测。问题是在假设 的条件下估计F。

例:非参数推断 6.4例(非参数密度估计)设 是CDF F 的独立观测,令 是其PDF。 假设我们要估计f 。在只假设 的条件下,不可能估计出 f。我们需要假设f的平滑性。 例如,可假设 ,其中 是满足下述条件的所有概率密度函数的集合 类 称为Sobolev 空间;是 “波动不大” 的函数的集合。

例:非参数推断 6.5例(函数的非参数估计):令 ,我们要估计 , 仅假设μ存在。 均值μ可被认为是F的函数,可写成 6.5例(函数的非参数估计):令 ,我们要估计 , 仅假设μ存在。 均值μ可被认为是F的函数,可写成 通常,任意F 的函数可认为统计函数/统计泛函。 方差: 中值:

例:监督学习 假设有成对的观测数据 , X:特征/独立变量/预测子/回归子 Y:输出/依赖变量/响应变量 :回归函数 假设有成对的观测数据 , 如 为第i个人的血压, 为其寿命 X:特征/独立变量/预测子/回归子 Y:输出/依赖变量/响应变量 :回归函数 参数回归模型: ,其中 为有限维 如线性回归: 为直线集合, 非参数回归模型: ,其中 为无限维 如核回归:

例:监督学习(续) 预测:给定新的X的值,估计Y的值 分类:当Y为离散值时的预测 回归/曲线拟合/曲线估计:估计函数 回归模型:

统计推断方法 频率推断 贝叶斯推断

注意 在参数模型中,若 为参数模型,我们记 下标θ表示概率或期望是与 有关,而不是对θ求平均

点估计 点估计是指对某个感兴趣的量的真值 做一个最佳估计,这个估计称为 或 ,因为它取决于数据,所以 是一个随机变量。 点估计是指对某个感兴趣的量的真值 做一个最佳估计,这个估计称为 或 ,因为它取决于数据,所以 是一个随机变量。 但 θ为固定值,虽然未知 如果 X1, …,Xn 是从某个分布F的IID数据点,参数θ的点估计为X1, … ,Xn 的函数:

抽样分布(Sampling Distribution) 的分布称为抽样分布 的标准差 (standard deviation)称为标准误差 (standard error) 标准误差的估计值称为

估计量的评价标准 一个好的估计有什么性质? 无偏性 一致性 有效性 估计的偏差(bias)为 对分布 求期望,而不是对θ平均 若 ,则该估计是无偏估计。 一致性 若 ,则该点估计是一致的。 有效性 无偏估计中,方差较小的一个更有效(收敛速度更快) 对分布 求期望,而不是对θ平均

偏差—方差分解 点估计的性能有时通过均方误差(MSE, mean squared error)来评价: MSE可分解为 对无偏估计,bias=0,所以 估计的偏差/正确性 估计的变化程度/精度 无偏估计的MSE不一定最小,还需考虑估计的方差

偏差—方差分解

偏差—方差分解 若 时, 且 ,则 是一致的,即 证明: 所以 所以 (qm收敛定义) 所以

例:Bernoulli分布中的参数估计 令 为p无偏估计 标准误差为 所以 , 为一致估计 估计的标准误差为

置信区间 参数的1-α置信区间为区间 ,其中 和 是数据的函数,使得 区间(a,b)以1-α的概率覆盖θ 参数的1-α置信区间为区间 ,其中 和 是数据的函数,使得 区间(a,b)以1-α的概率覆盖θ 1-α:置信区间的覆盖度(coverage) 置信区间表示了我们对未知参数的不确定程度 置信区间宽,表示若要对参数有个比较确定的解,需要更多样本数据

渐近正态性 如果满足 则该估计是渐近正态的(asymptotically normal)。 如果一个估计是渐近正态的,可以比较方便地得到其置信区间。

基于正态分布的置信区间 假设 , 令 , 即 且 其中 , 令 则 如对95%的置信区间, 则95%的置信区间约为

例:二项分布的置信区间 令 其中 则根据Hoeffding不等式 对每个p, 所以 为1-α置信区间。 根据CLT, 则1-α置信区间为 所以 为1-α置信区间。 根据CLT, 则1-α置信区间为 基于正态的区间比基于Hoeffding不等式的区间小,但CLT只是近似(在大样本时)

假设检验 假设检验:从缺省理论-零假设/原假设(null hypothesis)开始 问题:数据是否提供了足够多的证据以拒绝该理论 是:拒绝原假设 否:接受原假设

例:检验硬币是否公正 假设 表示n次独立的抛硬币试验,我们想知道该硬币是否公正 原假设 :硬币是公正的 备择假设 :硬币是不公正的 记为: 原假设 :硬币是公正的 备择假设 :硬币是不公正的 记为: 当 较大时,拒绝 问题:T应为多大?(拒绝域/接受域/显著水平) 一般不能轻易拒绝

总结 统计推断的基本概念 一个好的估计: 模型、模型估计、估计的评价 偏差小 方差/标准误差小 MSE小 一致性 鲁棒性(当样本数据有噪声时,仍能得到一个好的估计) ……. 对同一个未知量,我们可以用不同的模型和不同的推断方法来得到其估计,这些估计的性质可能不一样 参数模型/非参数模型 频率推断/Bayesian推断 如不同的分类器、不同的回归方法、不同的概率密度估计方法 重点掌握偏差、标准误差和MSE的计算

作业 Chp6的1、2、3 交作业时间在布置作业的2周后,作业序号请以教材章节为准 第6章作业: