上节课内容总结 统计推断基本概念 CDF估计: 统计函数估计 统计模型:参数模型与非参数模型 统计推断/模型估计:点估计、区间估计、假设检验

Slides:



Advertisements
Similar presentations
1 曾老師、各位同學大家好 ! 首先自我介紹 ; 個人聯合大學電機系 畢業,服完兩年兵役後, 75 年開始就 業 ; 四年內換了幾個工作, 79 年創立貿 特科技, 90 年、 91 年分別於大陸寧波 與昆山設立特一電子與柏特電子,經 歷 20 年的工作磨鍊,今天事業上算是 穩定、成熟 ! 承蒙曾老師看重,利用一.
Advertisements

中正國中 特教組長 粘玉芳 校內分機 : /02/21. 下列條件擇一: 一、身心障礙手冊 二、特殊教育學生鑑定及就學輔導會證明.
教师队伍建设 组员:王英利 赵香媖 侯娟. 主讲内容 2. 中小学教师队伍建设 1. 职业教育师资队伍建设国际比较 3. 高校教师队伍建设与管理.
如何科学认识风水 主讲嘉宾孙百川 揭开神秘的面纱 揭开神秘的面纱 破除迷信的枷锁 破除迷信的枷锁 还易经本来面目 还易经本来面目 学易用易不迷易 学易用易不迷易.
政治全球化 促進國際間的了解, 抑或加劇了種族、宗教、文化和政 治實體之間的衝突 ?. 政治全球化 指一個國家或國際的政治事務,由一國或少數國家決定的模 式,逐漸過渡至複雜的跨國以至全球決策模式 政治活動和政治決策跨越國家界限.
2 Chp1 知识概述 一、莆田概况 1 、位置 位于北纬 25° ,东经 119° , 背山面海,北依省会福州市, 南邻泉州市。东南靠濒海,与 台湾省隔海相望。 2 、面积 全市陆地面积约为 3781 平 方千米。海域面积 1.1 万平方 千米。
一、老师申请题目,以下指导老 师操作。 1. 登录教务系统 web 端. 2. 点击 “ 毕业设计 ” 工具栏下拉菜单中的 “ 论文 _ 教师申请题目 ”
全国青少年科技创新大赛 科技辅导员项目组织与实施
提 纲 三次考察与改革的回顾 1 学院三周来的新面貌 及下一步工作思路 2 凝心聚力、团结协作、狠抓落实 3.
——以通渭县图书馆青树小项目“携老上网游”为例
对应用型本科建设中若干问题的认识 张家钰
第八章 收益分配决策补:案例,习题 本章结构、主要内容、重点难点: 收益分配的原则;程序 收益分配的政策: 影响股利的因素 股利政策的种类
工商心理學導論 第六章 訓練與發展.
政府採購法令概要 政府採購類型 1.工程採購 2.財物採購 3.勞務採購.
劳动关系法务-实操篇 规章制度修审与员工手册撰写.
湖南省科学技术奖励 推荐工作要求.
出生於浙江金華, 八歲隨父母遷台 就讀北一女中, 畢業於台灣 東吳大學中文系 散文《地毯的那一端》等 劇本《曉風戲劇集》 余光中譽之為 「亦秀亦豪的健筆」 2010為了捍衛兵工廠 沼澤綠地投書聯合報.
An Introduction to Database System
2013浙江省行测专题 密卷解析及备考冲刺 罗 姮.
信心的晨禱 經文: 詩篇 3 日期:
大 Statistical Thinking 统计分析的第三范式: 数据 & 贝叶斯之 天津财经大学
何处安放 我们的青春? 透视 大学毕业生 “族化”生存现象.
個人投資理財分析 財務狀況匯總表 銀行存款 共同基金 外幣基金 股票投資 保險價值 黃金投資 支出預算 房貸計算 不動產價值 資源變化資料庫
在系統完成資料填報後 系統產生所有表件請全數印出 如下載的表件為「空白」文件,請安裝PDF中文字型 ★系統參考畫面:
第八章 网络课程的设计与开发.
班级安全文化建设的思考与实践 夯实安全基础 规范安全行为 培养安全习惯 训练安全能力 尤 学 文 管 理 学 博 士
五年級上學期 體育課教學方案 設計者:吳文芳.
数字图像处理 Digital Image Processing.
广东省高新技术企业培育库入库企业认定(第二批)工作介绍
文学名作与影视改编 郁达夫文学作品及相关影视赏析 授课教师 胡芳.
第三章 心理安全 广西师范大学 罗蕾.
甄選入學招生 第二階段集體及個別報名系統 系統開放時間:102/6/3 10:00~ 102/6/7 17:00止
时间管理 -----高一团体辅导.
做最好的自己 ——七(6)班主题班会.
互联网时代班主任的挑战 万玮 2014年9月20日.
时代发展趋势: 科学人文交融 华中科技大学 杨叔子 2010年2月修改.
中国未成年人法制安全课程 酒精饮料我不喝 小学段 第三讲 NO.
政府採購法令概要 政府採購類型 1.工程採購 2.財物採購 3.勞務採購 1.
关注空巢老人的心理健康 525宿舍.
第九課 現代詩選 (ㄧ)再別康橋 (二)斷  章.
負責同仁:許慧楨小姐 系辦公室6號櫃臺 學務/獎助學金 負責同仁:許慧楨小姐 系辦公室6號櫃臺
统计学习基础 卿来云 中国科学院研究生院信息学院 / 统计对研究的意义:
大学生 就业、生活及价值观追踪调查2013年度数据发布
Department of Computer Science & Information Engineering
鄉村尋根-農具篇.
Introduction to Computer Graphics
Chp7:非参数估计 CDF估计 点估计 区间估计 统计函数估计.
Chp9:参数推断 本节课内容:计算似然的极大值 牛顿法 EM算法.
VISP+MS 国际高校访问学生 及统计理学硕士项目
一般論文的格式 註:這裡指的是一般 journal papers 和 conference papers 的格式。
排列组合 1. 两个基本原理 分类加法计数原理 分步乘法计数原理.
分子建模与模拟导论 主讲:王延颋, 中国科学院理论物理研究所 助教: 邓礼, 中国科学院理论物理研究所
風險值(VaR) 的理論與應用 授課老師: 林允永 博士 淡江大學金融所.
全文检索 墨香简介 平台功能 产品优势 产品对比
第三节 常见天气系统.
中汇会计师事务所(特殊普通合伙)无锡分所
教學觀摩會 教學經驗分享 . 電機學院電機系--林源倍.
107年 國中教育會考 准考證資料處理系統 學校版 (集體報名單位) 操作說明
108新課綱教學目標與特色 (一)強化務實致用 (二)落實課程連貫 (三)深化基本職能 (四)符應產業需求 考招連動配套 部定實習科目
第二部分:统计推断 Chp6:统计推断概述 Chp7:非参数推断 Chp8:Bootstrap Chp9:参数推断 Chp10:假设检验
“修身成材” 班级干部培训班 黑龙江大学党委学工部.
鋼液冶煉製程介紹.
新疆维吾尔自治区高校科研计划项目网络管理平台项目申报操作指南
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
新疆维吾尔自治区高校科研计划项目网络管理平台项目申报操作指南
轉換成二進位、八進位及十六進位 = ( ) = ( ) = ( )16.
大學考招新方案與銜接配套措施 【十二年國民基本教育課程綱要宣講】 教育部 大學招生委員會聯合會 108 年 9月.
海葵與小丑魚 照片來源:
Presentation transcript:

上节课内容总结 统计推断基本概念 CDF估计: 统计函数估计 统计模型:参数模型与非参数模型 统计推断/模型估计:点估计、区间估计、假设检验 估计的评价:无偏性、一致性、有效性、MSE 偏差、方差、区间估计 CDF估计: 点估计、偏差、方差及区间估计 统计函数估计 点估计 区间估计/标准误差 影响函数 Bootstrap Bootstrap也可用于偏差、置信区间和分布估计等计算

本节课内容 重采样技术(resampling) Bootstrap 刀切法(jackknife)

引言 假设我们想知道 的方差 如果 的形式比较简单,可以直接用上节课学习的嵌入式估计量 作为 的估计 例: ,则 ,其中 是一个统计量,或者是数据的某个函数,数据来自某个未知的分布F,我们想知道 的某些性质(如偏差、方差和置信区间) 假设我们想知道 的方差 如果 的形式比较简单,可以直接用上节课学习的嵌入式估计量 作为 的估计 例: ,则 ,其中 问题:若 的形式很复杂(任意统计量),如何计算/估计?

Bootstrap简介 Bootstrap是一个很通用的工具,用来估计标准误差、置信区间和偏差。由Bradley Efron于1979年提出,用于计算任意估计的标准误差 术语“Bootstrap”来自短语“to pull oneself up by one’s bootstraps” (源自西方神话故事“ The Adventures of Baron Munchausen”,男爵掉到了深湖底,没有工具,所以他想到了拎着鞋带将自己提起来) 计算机的引导程序boot也来源于此 意义:不靠外界力量,而靠自身提升自己的性能,翻译为自助/自举 1980年代很流行,因为计算机被引入统计实践中来

Bootstrap简介 Bootstrap:利用计算机手段进行重采样 一种基于数据的模拟(simulation)方法,用于统计推断。基本思想是:利用样本数据计算统计量和估计样本分布,而不对模型做任何假设(非参数bootstrap) 无需标准误差的理论计算,因此不关心估计的数学形式有多复杂 Bootstrap有两种形式:非参数bootstrap和参数化的bootstrap,但基本思想都是模拟

重采样 通过从原始数据 进行n次有放回采样n个数据,得到bootstrap样本 如:若原始样本为 则bootstrap样本可能为 对原始数据进行有放回的随机采样,抽取的样本数目同原始样本数目一样 如:若原始样本为 则bootstrap样本可能为 …

计算bootstrap样本 重复B次, Web上有matlab代码: 1. 随机选择整数 ,每个整数的取值范围为[1, n],选择每个[1, n]之间的整数的概率相等,均为 2. 计算bootstrap样本为: Web上有matlab代码: BOOTSTRAP MATLAB TOOLBOX, by Abdelhak M. Zoubir and D. Robert Iskander, http://www.csp.curtin.edu.au/downloads/bootstrap_ toolbox.html Matlab函数:bootstrp

Bootstrap样本 在一次bootstrap采样中,某些原始样本可能没被采到,另外一些样本可能被采样多次

模拟 假设我们从 的分布 中抽取IID样本 ,当 时,根据大数定律, 也就是说,如果我们从 中抽取大量样本,我们可以用样本均值 来近似 也就是说,如果我们从 中抽取大量样本,我们可以用样本均值 来近似 当样本数目B足够大时,样本均值 与期望 之间的差别可以忽略不计

模拟 更一般地,对任意均值有限的函数h,当 有 则当 时,有 用模拟样本的方差来近似方差

模拟 怎样得到 的分布? 怎样得到F?用 代替(嵌入式估计量) 怎样从 中采样? 已知的只有X,但是我们可以讨论X的分布F 怎样得到 的分布? 已知的只有X,但是我们可以讨论X的分布F 如果我们可以从分布F中得到样本 ,我们可以计算 怎样得到F?用 代替(嵌入式估计量) 怎样从 中采样? 因为 对每个数据点 的质量都为1/n 所以从 中抽取一个样本等价于从原始数据随机抽取一个样本 也就是说:为了模拟 ,可以通过有放回地随机抽取n个样本(bootstrap 样本)来实现

Bootstrap:一个重采样过程 重采样: 模拟: 通过从原始数据 进行有放回采样n个数据,得到bootstrap样本 为了估计我们感兴趣的统计量 的方差/中值/均值,我们用 bootstrap样本对应的统计量(bootstrap复制) 近似,其中

例:中值 X1=(1.57,0.22,19.67, 0,0,2.2,3.12) Mean=4.13 X = (3.12, 0, 1.57, 19.67, 0.22, 2.20) Mean=4.46 X2=(0, 2.20, 2.20, 2.20, 19.67, 1.57) Mean=4.64 X3=(0.22, 3.12,1.57, 3.12, 2.20, 0.22) Mean=1.74

Bootstrap方差估计 方差: 其中 通过两步实现: 注意:F为数据X的分布,G为统计量T的分布 第一步:用 估计 第一步:用 估计 插入估计,积分符号变成求和 第二步:通过从 中采样来近似计算 Bootstrap采样+大数定律近似

Bootstrap:方差估计 Bootstrap的步骤: 1.画出 2.计算 3.重复步骤1和2共B次,得到 4. (计算boostrap样本) (计算boostrap复制) (大数定律)

例:混合高斯模型: 假设真实分布为 现有n=100个观测样本: 直接用嵌入式估计结果:

例:混合高斯模型(续) 用Bootstrap计算统计量 的方差: 1. 得到B=1000个bootstrap样本 ,其中 3. 与直接用嵌入式估计得到的结果比较:

Bootstrap:方差估计 真实世界: Bootstrap世界: 发生了两个近似 近似的程度与原始样本数目n及bootstrap样本的数目B有关

Bootstrap:方差估计 在方差估计中, 可为任意统计函数 除了用来计算方差外,还可以用作其他应用 如均值(混合高斯模型的例子) 在方差估计中, 可为任意统计函数 如均值(混合高斯模型的例子) 中值(伪代码参见教材) 偏度(例子参见教材) 极大值(见后续例子) … 除了用来计算方差外,还可以用作其他应用 CDF近似、偏差估计、置信区间估计

CDF近似 令 为 的CDF 则 的bootstrap估计为

偏差估计 偏差的bootstrap估计定义为: Bootstrap偏差估计的步骤为: 得到B个独立bootstrap样本

例:混合高斯模型: 标准误差估计 偏差估计 在标准误差估计中,B为50到200之间结果比较稳定 B 10 20 50 100 500 1000 10000 0.1386 0.2188 0.2245 0.2142 0.2248 0.2212 0.2187 B 10 20 50 100 500 1000 10000 5.0587 4.9551 5.0244 4.9883 4.9945 5.0035 4.9996 0.0617 -0.0417 0.0274 -0.0087 -0.0025 0.0064 0.0025

Bootstrap置信区间 正态区间: 百分位区间: ,对应 的样本分位数 还有其他一些计算置信区间的方法 简单,但该估计不是很准确,除非 接近正态分布 百分位区间: ,对应 的样本分位数 还有其他一些计算置信区间的方法 如枢轴置信区间:

例:Bootstrap置信区间 例8.6:Bootstrap方法的发明者Bradley Efron给出了下列用语解释Bootstrap方法的例子。这些数据是LAST分数(法学院的入学分数)和GPA。计算相关系数及其标准误差。 LSAT (Y) 576 635 558 578 666 580 555 661 651 605 653 575 545 572 594 GPA (Z) 3.39 3.30 2.81 3.03 3.44 3.07 3.00 3.43 3.36 3.13 3.12 2.74 2.76 2.88 2.96

例8.6 (续) 相关系数的定义为: 相关系数的嵌入式估计量为: Bootstrap得到的相关系数插入估计的标准误差为: 标准误差趋向稳定于 25 50 100 200 400 800 1600 3200 0.140 0.142 0.151 0.143 0.141 0.137 0.133 0.132 标准误差趋向稳定于

例8.6 (续) 当B=1000时, 的直方图为下图,可近似为从 的分布采样 95%的正态区间为: 95%的百分点区间为: 的直方图为下图,可近似为从 的分布采样 95%的正态区间为: 95%的百分点区间为: 当大样本情况下,这两个区间趋近于相同

非参数bootstrap过程总结 对原始样本数据 进行重采样,得到B个bootstrap样本 ,其中b=1, …, B 对每个bootstrap样本 ,计算其对应的统计量的值(bootstrap复制) 根据bootstrap复制 ,计算其方差、偏差和置信区间等 称为非参数bootstrap方法,因为没有对F的先验(即F的知识仅从样本数据中获得)

非参数bootstrap 统计量/统计函数: 没有对F的先验,F的知识仅从样本数据中获得(CDF估计),统计函数的估计变为嵌入式估计 真实世界: Bootstrap世界: 如方差计算中,发生了两个近似 近似的程度与样本数目n及bootstrap样本的数目B有关

Bootstrap的收敛性 例:混合高斯模型: n=100个观测样本: 4次试验得到不同B的偏差和方差的结果

Bootstrap的收敛性 B的选择取决于 计算机的可用性 问题的类型:标准误差/偏差/置信区间/… 问题的复杂程度

Bootstrap失败的一个例子 ,我们感兴趣的统计量 为 的CDF用G表示 则 的pdf为

Bootstrap失败的一个例子(续) 对非参数bootstrap,令 则 所以 ,非参数bootstrap不能很好地模拟真正的分布

Bootstrap失败的一个例子(续) 假设样本数目n=10,样本为 ,取参数 X = (0.5729,0.1873,0.5984,0.2883,0.8722,0.4320,0.4896,0.7106,0.2754,0.7637) 理论结果: 非参数bootstrap复制 的直方图 B=1000,最高峰为

Bootstrap失败的一个例子 为什么失败? EDF 不是真正分布 的很好近似 为了得到更好的结果,需要F的参数知识或者 的平滑性

Bootstrap的收敛性 给定n个IID数据 ,要求 当 , 收敛于F 为 的嵌入式估计 统计函数的平滑性 平滑函数: 为 的嵌入式估计 统计函数的平滑性 平滑函数: 均值、方差… 不平滑函数:数据的一个小的变化会带来统计量的很大变化 顺序统计量的极值(极大值、极小值)

参数化的bootstrap 真实世界: Bootstrap世界: 与非参数的bootstrap相比: F的先验 F的先验用参数模型表示 多了一个步骤:根据数据估计参数 (参数估计),从而得到 不是经验分布函数EDF 重采样:从估计的分布 采样(产生随机数) F的先验

例: 非参数bootstrap失败的例子 ,取参数 ,假设样本数目n=10,样本为 在参数bootstrap中: F的先验: X = (0.5729,0.1873,0.5984,0.2883,0.8722,0.4320,0.4896,0.7106,0.2754,0.7637) 在参数bootstrap中: F的先验: 根据数据估计F中的参数: 得到F的估计: 从分布 产生B=1000个样本 , 得到B个 , 直方图如右图 的分布为真正的分布

参数化的bootstrap 当F为参数模型时,参数化的bootstrap也可用于计算方差、偏差、置信区间等 如计算方差: 0. 根据数据 估计 f 的参数 ,得到 f 的估计 1. 抽取样本 2. 计算 3. 重复步骤1和2 B次,得到 4.

参数bootstrap Vs. 非参数的bootstrap F的先验 参数bootstrap中利用了分布F的先验,表现为一个参数模型,因此多了一个步骤,估计F模型中的参数。当先验模型正确时,参数bootstrap能得到更好的结果 而非参数bootstrap不利用F的先验知识就能得到正确的标准误差(在大多数情况下) 参数bootstrap能得到与Delta方法(计算变量的函数的方差)相当的结果,但更简单 重采样 参数bootstrap中,通过从分布 中产生随机数,得到 bootstrap样本,得到的样本通常与原始样本不重合 非参数bootstrap中,通过对原始样本进行有放回采样实现对 的采样,每个bootstrap样本都是原始样本集合的一部分 二者相同的是模拟的思想

Bootstrap(参数/非参数)不适合的场合 小样本(n太小) 原始样本不能很好地代表总体分布 Bootstrap只能覆盖原始样本的一部分,带来更大的偏差 结构间有关联 如时间/空间序列信号 因为bootstrap假设个样本间独立 脏数据 奇异点(outliers)给估计带来了变化

刀切法(jackknife)

引言 Bootstrap方法并不总是最佳的。其中一个主要原因是bootstrap样本是从 产生而不是从F产生。 如果样本数目为n,答案是否定的! 若样本数目为m (m < n),则可以从F中找到数目为m的采样/重采样,通过从原始样本X得到不同的子集就可以! 寻找原始样本的不同子集相当于从观测 进行无放回采样,得到数目为m的重采样样本(在此称为子样本)这就是jackknife的基本思想。

刀切法(jackknife) Jackknife由Maurice Quenouille (1949)首先提出 比bootstrap出现更早 与bootstrap相比,Jackknife ( m=n-1) 对计算机不敏感。 Jackknife为一种瑞士小折刀,很容易携带。通过类比, John W. Tukey (1958)在统计学中创造了这个术语,作为一种通用的假设检验和置信区间计算的方法。

Jackknife样本 Jackknife样本定义为:一次从原始样本 中留出一个样本 : Jackknife样本中的样本数目为m=n-1 共有n个不同的jackknife样本 无需通过采样手段得到 jackknife样本 BOOTSTRAP MATLAB TOOLBOX中也有该功能

Jackknife复制 统计量为: Jackknife复制为: 均值的jackknife复制为:

Jackknife方差估计 从原始样本X中计算n个jackknife样本 计算n个jackknife复制:

例:计算均值的方差 ,则 所以 方差的无偏估计

例:计算均值的方差 因子 比bootstrap中的因子 大多了。 直观上,因为jackknife 方差 比bootstrap中的方差 小得多(相比bootstrap样本,jackknife样本与原始样本更相似 事实上,因子 就是考虑特殊情况 得到的 (有点武断)

例:混合高斯模型: Bootstrap结果: Jacknife结果: B 10 20 50 100 500 1000 10000 0.1386 0.2188 0.2245 0.2142 0.2248 0.2212 0.2187 0.0617 -0.0417 0.0274 -0.0087 -0.0025 0.0064 0.0025

例:混合高斯模型: 复制的直方图 1000个Bootstrap复制 100个Jacknife复制 Jackknife复制之间的差异很小,每两个Jackknife样本中只有两个单个的原始样本不同

Jackknife Vs. bootstrap 当n较小时,能更容易(更快)计算 n个 jackknife复制。 但是,与bootstrap 相比,jackknife只利用了更少的信息(更少的样本) 。 事实上, jackknife为bootstrap的一个近似(jackknife方差为bootstrap方差的一阶近似)! 估计样本分位数时,jackknife计算的方差不是一致估计

Jackknife的其他应用 Jackknife可用于类似bootstrap的应用,如偏差估计

Jackknife不适合的场合 统计函数不是平滑函数:数据小的变化会带来统计量的一个大的变化 如极值、中值 如对数据 X=(10,27,31,40,46,50,52,104,146)的中值 得到的结果为48,48,48,48,45,43,43,43,43 偶数个数的中值为最中间两个数的平均值 当函数不平滑时,可以用delete-d jackknife子采样来弥补 每个delete-d jackknife样本中的样本的数目为n-d 共有 个不同的delete-d jackknife样本 d的取值:

参考文献 Books Special issues An Introduction to Bootstrap, B. Efron and R. J. Tibshirani, Chapman & Hall, 1998. Bootstrap Methods and Their Application, A. Davidson and D. Hinkley, Cambridge University Press, 1997. Randomization, Bootstrapping, and Monte Carlo Methods in Biology, Manly, Chapman & Hall, 1997. Special issues Silver Anniversary of the Bootstrap, Statistical Science, Vol. 18, nb. 2, May 2003. Signal Processing Applications Of The Bootstrap by S. Shamsunder; Computer-intensive methods in statistical analysis by D.N. Politis; The bootstrap and its application in signal processing, A.M. Zoubir and B. Boashash, in IEEE Signal Processing Magazine, January 1998. ——有Demo

参考文献 对bootstrap的批判 Exploring the limits of bootstrap edited, by Le Page and Billard, 1990

下节课内容 作业: Chp8: 第1、6题 第1题GPA的最后一个数值为2.96 下节课内容 参数推断:Chp9