Chp7:非参数估计 CDF估计 点估计 区间估计 统计函数估计.

Slides:



Advertisements
Similar presentations
12.7 脂肪食物與健康 我的膽固醇偏高, 不宜吃這些快餐食 物啊! 爺爺,我想集齊 這套玩具啊!不 如進去吃吧! 為甚麼膽固醇偏高的人 不宜吃過多快餐食物?
Advertisements

第二部分 种群生态学. 4.1 种群的概念  种群 (population) 是在一定空间中同种个 体的组合的群。  这是最一般的定义,表示种群是由同种个体组 成的,占有一定的领域,是同种个体通过种内 关系组成的一个统一体或系统。除生态学外, 进化论、遗传学、分类学和生物地理学等都使 用种群这个术语。
莊曜聰 醫師 高血壓與高血脂. 92 年國人十大死因排行榜及每日死亡人數 NO.2 腦血管疾病 ( 每 42 分 22 秒有 1 人死亡 ) 34 人 / 日 NO.3 心臟疾病 ( 每 44 分 36 秒有 1 人死亡 ) 32 人 / 日 NO.4 糖尿病 ( 每 52 分 30 秒有 1 人死亡.
商用微積分 CHAPTER3 微分. 3.1 微分基本公式 ( 求導法則 ) 3.2 乘積公式及商公式 3.3 鏈規則 3.4 經濟上的邊際函數 3.5 高階導函數 3.6 隱微分及相關變化率 3.7 微分 第 3 章公式 第 3 章復習題.
全球佈局,打響捷安特品牌 巨大將子公司視為當地策略夥伴 巨大將子公司視為當地策略夥伴 母公司負責提供所有必要的資源 母公司負責提供所有必要的資源 海外子公司總經理則在前線帶兵打仗 海外子公司總經理則在前線帶兵打仗.
AIA confidential and proprietary information. Not for distribution. “ 友邦爱心图书馆 ” 项目总结报告 中国区品牌与企业传播部
2 Chp1 知识概述 一、莆田概况 1 、位置 位于北纬 25° ,东经 119° , 背山面海,北依省会福州市, 南邻泉州市。东南靠濒海,与 台湾省隔海相望。 2 、面积 全市陆地面积约为 3781 平 方千米。海域面积 1.1 万平方 千米。
第二十章 生物制品分析. 本章主要内容 生物制品 的分类 生物制品的 质量要求 生物制品 鉴别试验、 检查内容.
第六章 患者的清洁卫生.
名以清修 利以义制 绩以勤勉 汇通天下 新晋商理念 李安平
莊子的逍遙無待之道.
2012年9月等级考试辅导 第二章 程序设计基础.
现代政府理论的四维分析框架 朱光磊 2012年8月.
第二节 通过激素的调节 促胰液素是人们发现的第一种激素
估計的基本概念 估計量之性質 估計之方法 區間估計之基本概念 平均數之區間估計 樣本大小.
護理高等教育教學目標與學生能力指標之訂定與監測
第二章:随机变量 上节课内容 本节课内容 概率理论 随机变量及其分布 随机变量变换 常见分布族 多元随机向量的分布 概率公理及推论
臺股指數期貨的操作 .
十年期国债期货首日操作策略 浙商期货研究院:刘鹏.
恒泰期货研究所2016年 期债暴跌告一段落,短期波动降低 国债期货周报
第十三章 网络计划技术.
介绍一些等离子体物理的基本概念,为进一步学习等离子体物理做些引导。
ETF分级基金产品套利研究 数量分析组 2010年12月.
第六章 流通加工.
第一組成員 蕭毓文(1號) :內壢高中 范美珍(4號) :平鎮高中 林宏茂(6號) :中壢高中 林桂鳳(18號) :竹北高中
工作場所之 權力與影響力 第九章.
4.3 可持续发展的基本内涵 永嘉二中 钱凯俊.
第6节 眼和视觉 【学习目标】 1、了解什么是凸透镜,什么是凹透镜,了解透镜的焦点、焦距。 2、了解凸透镜和凹透镜对光的作用
求職.
11 物流仿真技术 11.1物流系统仿真 11.2 物流仿真方法 知识归纳 复习题.
翻转课堂模式下的高三物理一轮复习策略研究
Project Description.
班級經營 網路資源好幫手 邱瓊慧.
第三章 参数估计 Parametric Estimation
“十三五”期间 长三角中等职业教育发展展望
行政院勞工委員會 中區勞動檢查所 火災爆炸預防管理實務
手外伤与断指再植 上海第二医科大学 附属第九人民医院骨科.
電 子 工 程 系 資料庫系統期末報告 門市人流管理系統 組員: 吳事佳 楊琮琪
8.2 参数估计 §8.2.1 基本概念 一、估计量 估计值 人们往往知道随机变量(总体)的分布类型,但确切的函数形式并不知道,即总体的参数未知。参数估计就是要根据样本来估计出总体的未知参数。
社福場所的實地學習體驗 (與傷殘人士共融)
公民與社會第二冊 第三章 政府的體制.
上节课内容总结 统计推断基本概念 CDF估计: 统计函数估计 统计模型:参数模型与非参数模型 统计推断/模型估计:点估计、区间估计、假设检验
本章結構 前言 簡單範例-可靠度問題 產生隨機變數值 應用範例分析 模擬誤差分析-輸出資料分析 電腦軟體介紹 隨機亂數產生器
第一章.
時尚潮流 V.S. 模特兒 元件時數:1分鐘.
Chp9:参数推断 本节课内容:计算似然的极大值 牛顿法 EM算法.
第 7 章 抽樣與抽樣分配 Part A ( ).
正交试验设计在网上购物选择时的应用 统计 高璇 黄婷 刘璐(组长)
第4章 非线性规划 基本概念 2011年11月.
第一節 餐飲服務的定義及範圍 7-1 螺絲攻的種類與規格 螺絲攻的種類 螺絲攻的規格.
班級經營 網路資源好幫手 邱瓊慧.
固体力学 2016年秋季学期 授课教师: 冷伟 办公室 课时 (3-19周授课, 20周结课) 考察方式: 课程项目 (4-6个大作业) 50% 期末考试 50%
Chapter 8 Model Inference and Averaging
第八单元 Word和Excel 进阶应用.
有向無環圖支援向量機於多類 音樂識別之應用研究
交際障礙分組系統 大家好,關於我們的深碗計畫,交際障礙分組系統,是我們的主題。.
2 数字出版技术国家重点实验室(北大方正集团有限公司)
CH12-物流中心.
指導教授:林娟娟 教授 學生: 李奕勳 學生: 陳明楷
第二部分:统计推断 Chp6:统计推断概述 Chp7:非参数推断 Chp8:Bootstrap Chp9:参数推断 Chp10:假设检验
證券商風險控管機制 券商輔導部 103年8月.
第四章 常用概率分布 韩国君 教授.
网络营销管理及市场机会探讨 冯英健 2005年4月9日 首页.
第十一章評價模型在風險管理的運用 財務工程 呂瑞秋著.
讀人 Auto Play with Music From : TF
幂函数.
抽樣分配 許明宗.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
Presentation transcript:

Chp7:非参数估计 CDF估计 点估计 区间估计 统计函数估计

Chp7:非参数估计 一个非参数模型的例子: “非参数”并不意味着没有参数,而是指模型不能参数化(有无限个参数)。

非参数化方法 一些流行的非参数化方法: 直方图、核密度估计 (密度估计) 样条、小波回归 (回归) 核判别分析、最近邻、支持向量机SVM (分类)

非参数化方法 非参数模型有时亦称局部模型(local model) 如:核回归 常用核函数 :

CDF估计和统计函数估计 回到最基本状态,无需任何假设

经验分布函数 (Empirical Distribution Function, EDF) 令 为IID,则经验分布函数 定义为 其中 称为指示函数(indicator function)。 注意: 是基于排序好的样本数据的一个步长函数,在有样本时跳 1/n 。

是F的一个很好估计? 给定x, 是一个随机变量: 服从二项分布 所以

是F的一个很好估计? 所以 无偏估计 一致估计

EDF的置信区间 Glivenko-Cantelli 定理 Dvoretzky-Kiefer-Wolfowitz (DKW)不等式 如果 ,则 Dvoretzky-Kiefer-Wolfowitz (DKW)不等式 如果 ,则对任意 可根据下面的步骤构造F的1-α置信区间。

EDF置信区间 定义 则对任意F和所有x 所以 为F的 非参数置信区间。 其中

CDF估计举例 例7.2:神经纤维上相邻脉冲的相隔时间 时间t 95%的置信区间中的参数为:

统计函数的估计 统计函数/统计泛函:F的任意函数 统计函数的估计:嵌入式估计量(Plug-in Estimator) 均值: 方差: 中值: 的嵌入式估计量为 插入 代替未知的F

嵌入式估计量:线性函数 若对某个函数 ,有 ,则称T为一个线性函数。 T为一个线性函数: 该函数的嵌入式估计量为 例如:均值

例:方差 方差: 因此 注意:与样本方差稍有不同。 该估计不是无偏估计

例:偏度 令 和 分别表示随机变量X的均值和方差,偏度定义为: 表示分布偏离对称的程度。 因为 所以 的嵌入式估计量为:

例:样本相关系数 令 表示X与Y之间的相关系数,其中 为二元随机向量的分布 。 其中 用 代替 中的F,得到样本相关系数:

例:样本分位数 令F为密度为f的严格增函数 第p分位数: 的估计为 由于 不可逆,为避免歧义,定义 称为样本分位数。

线性函数估计的置信区间 通常可以假定线性函数满足中心极限定理,即 这样只要知道了 ,就可以比较容易得到置信区间:渐近正态性 这样只要知道了 ,就可以比较容易得到置信区间:渐近正态性 基于正态的置信区间: 如95%的置信区间为: 问题:标准误差 的估计

标准误差 的估计 影响函数 Bootstrap方法

影响函数 (Influence Functions) 影响函数用于估计一个嵌入式估计量的标准误差。影响函数定义为 其中δx 为x处的一个Delta函数, 为F和点x的混合体 影响函数形式同导数相同,表示统计函数 的变化率。影响函数越大,当F变成 时, 变化越大(与估计的方差有关) 概率为1- 概率为

经验影响函数 影响函数为 简记为 经验影响函数为

影响函数的性质 令 为一个线性函数, 则 1. 证明: T(F)是线性函数

影响函数的性质 2. 对任意G,有 证明:

影响函数的性质 3. L的期望为0 证明:

影响函数的性质 L的方差 4. 令 ,若 ,则 证明:根据性质2,令 所以 根据CLT,

影响函数的性质 5. 令 则 其中 证明:

影响函数的性质 证明(续):类似的, 根据大数定律, 另 所以

影响函数的性质 6. 证明:根据性质4和性质5,将性质4中 中的 用其估计 代替,极限分布仍然成立,即 或

影响函数与标准误差 对线性函数, 令 得到标准误差估计: 最后: 可用于计算置信区间

例:均值 线性函数为 嵌入式估计量为 , 所以95%的置信区间为 。 与直接用方差的嵌入式估计量 结果一致

例7.11:Plasma Cholesterol 51位无心脏病病人的血浆胆固醇

例7.11:Plasma Cholesterol 320位动脉狭窄病人的血浆胆固醇

例7.11:Plasma Cholesterol 两组的差别: 无心脏病 195.27 5.0 有心脏病 216.19 2.4 两组的差别: 初步结论:有心脏病的病人的胆固醇更高。这个结论的可靠性需考察该估计的标准误差: 95%的置信区间: 方差较小该结论比较可靠 但并不能马上说明胆固醇会引起心脏病(不一定是因果关系)

总结 CDF估计 点估计、偏差、区间估计(方差) 统计函数估计 点估计:嵌入式估计量 区间估计(方差) :影响函数、Bootstrap

作业 Chp7的2、3、4、8、9 下节课内容 Bootstrap