第二章:随机变量 上节课内容 本节课内容 概率理论 随机变量及其分布 随机变量变换 常见分布族 多元随机向量的分布 概率公理及推论

Slides:



Advertisements
Similar presentations
北大附中深圳南山分校 倪 杰 2016年8月25日星期四 2016年8月25日星期四 2016年8月25日星期四 Ox y 1 1 y=a x (a>1)
Advertisements

猜谜语 有个小娃娃,真是没 礼貌。 见到小树摇一摇,吓 得树叶哇哇叫。 见到小花逗一逗,摘 去她的太阳帽。 没人和它交朋友,只 好自已到外处跑。
政治全球化 促進國際間的了解, 抑或加劇了種族、宗教、文化和政 治實體之間的衝突 ?. 政治全球化 指一個國家或國際的政治事務,由一國或少數國家決定的模 式,逐漸過渡至複雜的跨國以至全球決策模式 政治活動和政治決策跨越國家界限.
2 Chp1 知识概述 一、莆田概况 1 、位置 位于北纬 25° ,东经 119° , 背山面海,北依省会福州市, 南邻泉州市。东南靠濒海,与 台湾省隔海相望。 2 、面积 全市陆地面积约为 3781 平 方千米。海域面积 1.1 万平方 千米。
第二章 中药药性理论的现代研究 掌握中药四性的现代研究 掌握中药五味的现代研究 掌握中药毒性的现代研究 了解中药归经的现代研究.
公務員申領小額款項專案法紀宣導 法務部廉政署 編製
全国青少年科技创新大赛 科技辅导员项目组织与实施
黄帝内经 内经教研室 王黎.
精神疾病与社区处理.
这是一个数字的 乐园 这里埋藏着丰富的 宝藏 请跟我一起走进数学的 殿堂.
第八章 收益分配决策补:案例,习题 本章结构、主要内容、重点难点: 收益分配的原则;程序 收益分配的政策: 影响股利的因素 股利政策的种类
职官与科举 职官:在国家机构中担任一定职务的官吏,这里面有职官的名称、职权范围和品级地位等方面的内容。
花开有日 芬芳天下 “国培计划(2012)” ——幼儿园骨干教师远程培训项目 山东幼儿园教师8班第4期简报 主办人:张瑞美     
《卖火柴的小女孩》 《海的女儿》 你 认 识 这 些 图 片 的 故 事 吗 《丑小鸭》 《拇指姑娘》 它们都来自于哪位作家笔下?
湖南省科学技术奖励 推荐工作要求.
创新大赛经验浅谈 高二(18)班 黄佳淇.
民主國家的政府體制 我國的中央政府體制 我國中央政府的功能 地方政府組織與功能
英 德 美 法 标志 1689年 《权利法案》 1871年 《德意志帝国宪法》 1787年宪法 1875年法兰西第三共和国宪法 政体 君主立宪制 民主共和制 行政权 内阁、首相 皇帝、宰相 总统 立法权 议会 国会 权力中心 皇帝 特点 君主虚位 议会至上 军事封建 皇帝权重 总统共和制 议会共和制.
离散随机变量及分布律 定义 个或可列个, 则称 X 为离散型随机变量 描述X 的概率特性常用概率分布或分布律 即 X 或 P §2.2
一、平面点集 定义: x、y ---自变量,u ---因变量. 点集 E ---定义域, --- 值域.
銷售與顧客關係管理 巫立宇.邱志聖 著.
機率的意義 機率運算法則 機率分佈 二項分佈 卜瓦松分佈
20、豆花庄的小家伙们.
CH11 心理疾病 李志鴻.
在系統完成資料填報後 系統產生所有表件請全數印出 如下載的表件為「空白」文件,請安裝PDF中文字型 ★系統參考畫面:
五年級上學期 體育課教學方案 設計者:吳文芳.
管理学基本知识.
华 夏 之 祖 第 3 课.
法學緒論第六單元:法律適用 設計課程︰ 財經法律系 --楊東連 法學緒論-6.
数理统计方法在化学中的应用 李振华 复旦大学化学系表面化学实验室 数理统计在化学中的应用.
广东省高新技术企业培育库入库企业认定(第二批)工作介绍
文学名作与影视改编 郁达夫文学作品及相关影视赏析 授课教师 胡芳.
滁州学院首届微课程教学设计竞赛 课程名称:高等数学 主讲人:胡贝贝 数学与金融学院.
CH1 . 集 合 与 命 题.
1.1.2 四 种 命 题.
甄選入學招生 第二階段集體及個別報名系統 系統開放時間:102/6/3 10:00~ 102/6/7 17:00止
Ch19 創業精神 管理學:整合觀點與創新思維3/e.中山大學企管系 著.前程文化 出版.
以考试说明带动二轮复习 福州第三中学 张璐.
拾貳、 教育行政 一、教育行政的意義 教育行政,可視為國家對教育事務的管理 ,以增進教育效果。 教育行政,乃是一利用有限資源在教育參
课标教材下教研工作的 实践与思考 山东临沂市教育科学研究中心 郭允远.
課程銜接 九年一貫暫行綱要( )  九年一貫課程綱要( ) 國立台南大學數學教育系 謝 堅.
第八章二元一次方程组 8.3实际问题与二元一次方程组.
第八章二元一次方程组 8.3实际问题与二元一次方程组 (第3课时).
2.4 二元一次方程组的应用(1).
关注空巢老人的心理健康 525宿舍.
友信不銹鋼工程有限公司 台北市康定路4號 工廠:台北縣三重市竹圍仔街22-3號
跨越海峡的生命桥.
6.2 常態機率分配 常態機率分配(normal probability distribution)可以說是最重要的連續機率分配。
第七章 SPSS的非参数检验.
本章結構 前言 簡單範例-可靠度問題 產生隨機變數值 應用範例分析 模擬誤差分析-輸出資料分析 電腦軟體介紹 隨機亂數產生器
Chp7:非参数估计 CDF估计 点估计 区间估计 统计函数估计.
2019年1月16日9时17分 概率论 Probability 江西财经大学 2017年 2019年1月16日9时17分.
全文检索 墨香简介 平台功能 产品优势 产品对比
中汇会计师事务所(特殊普通合伙)无锡分所
107年 國中教育會考 准考證資料處理系統 學校版 (集體報名單位) 操作說明
108新課綱教學目標與特色 (一)強化務實致用 (二)落實課程連貫 (三)深化基本職能 (四)符應產業需求 考招連動配套 部定實習科目
CH2 家庭經濟與消費 貳、家庭經濟之管理.
CH12-物流中心.
五.連續變數及常態分佈 (Continuous Random Variables and Normal Distribution)
第二部分:统计推断 Chp6:统计推断概述 Chp7:非参数推断 Chp8:Bootstrap Chp9:参数推断 Chp10:假设检验
統計學回顧 區國強.
鋼液冶煉製程介紹.
Copula function.
新疆维吾尔自治区高校科研计划项目网络管理平台项目申报操作指南
課程五 機率.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
新疆维吾尔自治区高校科研计划项目网络管理平台项目申报操作指南
第三章 导数及其应用.
用加減消去法解一元二次聯立方程式 台北縣立中山國中 第二團隊.
大學考招新方案與銜接配套措施 【十二年國民基本教育課程綱要宣講】 教育部 大學招生委員會聯合會 108 年 9月.
Presentation transcript:

第二章:随机变量 上节课内容 本节课内容 概率理论 随机变量及其分布 随机变量变换 常见分布族 多元随机向量的分布 概率公理及推论 随机事件之间的关系:条件概率、独立/条件独立、贝叶斯公式 本节课内容 随机变量及其分布 随机变量变换 常见分布族 多元随机向量的分布 联合分布、边缘分布、条件分布、独立

随机变量 统计推断是与数据相关的。随机变量就是将样本空间/随机事件与数据之间联系起来的纽带 随机变量是一个映射 ,将一个实数值 赋给一个试验的每一个输出 例2.2:抛10次硬币,令X(ω)表示序列ω中正面向上的次数,如当 ω = HHTHHTHHTT,则 X(ω) = 6。

随机变量的概率描述 事件的概率  随机变量的概率描述 给定一随机变量X及实数子集A,定义 例2.4:抛2次硬币,令X表示正面向上的次数,则 其中X表示随机变量,x表示X可能的取值 ω P({ω}) X(ω) TT 1/4 TH 1 HT HH 2 x P(X=x) 1/4 1 1/2 2

随机变量的分布函数 随机变量X的累积分布函数 (cumulative distribution function, CDF) 定义为 CDF是一个非常有用的函数:包含了随机变量的所有信息。 CDF的性质:略 (见书) 有时记为F

例:随机变量的CDF CDF 例2.6:公正地抛硬币2次,令X表示正面向上的次数,则 右连续、非减函数 对所有实数x都有定义 虽然随机变量只取0、1、2

离散型随机变量的概率函数 离散型随机变量的概率函数 (probability function or probability mass function, pmf)定义为 对所有的 CDF与pmf之间的关系为: 有时记为 f

例:离散型随机变量的pmf 例2.10:公正地抛硬币2次,令X表示正面向上的次数,则 概率函数为:

连续型随机变量的概率(密度)函数 对连续型随机变量X,如果存在一个函数 ,使得对所有的x, ,且对任意 有 则函数 被称为概率密度函数 (probability density function, pdf)。 CDF与pdf之间的关系: 在所有 可微的点x,则 注意: 是可能的

例:连续型随机变量的CDF和pmf 例2.12:设X有PDF: 显然有 有该密度的随机变量为(0,1)上的均匀分布:Uniform(0, 1),即在0和1之间随机选择一个点。 其CDF为:

分位函数 (quantile function) 令随机变量X的CDF为F,CDF的反函数或分位函数(quantile function)定义为 其中 。若F严格递增并且连续,则 为一个唯一确定的实数x,使得 。 为增函数 中值(median): 一个很有用的统计量,对噪声比较鲁棒

随机变量的变换 X:老的随机变量, Y:新的随机变量, 离散:

离散型随机变量的变换 例2.45:假设 Y的取值比X少,因为该变换不是一一映射。 x fX(x) -1 1/4 1/2 1 y fY(y) 1/2 1 y fY(y) 1/2 1

连续型随机变量的变换 CDF方法 变换的三个步骤 对每个y,计算集合 计算CDF PDF为

连续型随机变量的变换 当r为单调增函数/减函数,定义r的反函数 ,则 当X、Y存在一一映射时,上述结论仍可用—Jacobian方法 分区间:在每个 区间内为单调函数,可分区间利用上述结论

例:连续型随机变量的变换 例2.46: 则 令 或直接用Jacobian方法

例:连续型随机变量的变换 例:[概率积分变换] X有连续CDF ,定义随机变量Y为 ,则Y为[0,1]上的均匀分布,即 对随机数产生特别有用(Chp2第15题)

1.0 0.5

常见分布族 离散型随机变量 [Ch2, p25] 连续型随机变量 [Ch2, p27] 均匀(Uniform)分布 贝努利(Bernoulli)分布 二项(Binnomial)分布 超几何(HyperGeometric)分布 几何(Geometric)分布 泊松(Possion)分布 连续型随机变量 [Ch2, p27] 正态(Normal)分布 Gamma分布 Beta分布 分布 指数(Exponential)分布

常见分布族 每个分布族 pdf/pmf形式 参数 典型应用 均值、方差

正态分布 亦称高斯分布, : 位置(location)参数 : 尺度(scale)参数 如图像处理中的多尺度分析

正态分布 最重要的分布之一 在实际遇到的许多随机现象都服从或近似服从正态分布 中心极限定理:随机样本的均值近似服从正态分布 如考试成绩 对任意IID样本 ,则

标准正态分布 当 时,正态分布称为标准正态分布,通常用Z表示服从标准正态分布的变量,记为 。 标准化变换: pdf和CDF分别记为 标准化变换: 若 ,则 正态分布的线性组合仍是正态分布:若 是独立的,则

二元随机向量的联合分布 (X, Y):随机向量 离散型随机变量的联合分布:令X、Y为一对离散型随机变量,联合概率函数(pmf)定义为 联合概率分布函数(CDF)为:

例2.18:对如下有两个随机变量的二元分布,变量X和Y取值为0、1, 则 。 1 2/3 1/3 5/9 2/9 X=1 1/9 X=0 Y=1 Y=0 联合分布 边缘分布

二元随机向量的联合分布 连续型随机变量的联合分布:令X、Y对一对连续型随机变量,联合概率密度函数(pdf)定义为 对任意集合 联合概率分布函数(CDF)为:

边缘分布 离散型随机变量:

边缘分布 连续型随机变量: 联合分布包含了随机向量概率分布的信息 联合分布唯一确定了边缘分布,但反之通常不成立

独立 PDF可以因式分解

独立

随机变量之间的关系 独立 当且仅当 不独立:随机变量之间的关系用条件分布描述 条件分布: 

条件分布 第一节课中随机事件的条件概率: 离散型随机变量的条件概率函数: 对连续型随机变量,条件概率定义相同,但解释不同

条件分布 给定变量Y时,在 X上的概率分布 对Y的每个可能取值,对X都定义有一个概率分布 是一个概率分布,满足概率分布的所有性质,如

例:条件分布

联合分布、边缘分布与条件分布 边缘分布与联合分布: 条件分布与边缘分布、联合分布: 联合分布与条件分布、边缘分布:

条件概率  链规则(Chain Rule) 链规则 或

贝叶斯规则  似然 先验 贝叶斯规则 后验

贝叶斯规则中的边缘化 给定 和 ,推导 经常使用 贝叶斯规则的归一化因子 通过边缘化, 已知 ?

边缘分布 通过使用 (1) 边缘化和 (2) 链规则,给定 ,可以计算:

条件独立 (绝对)独立: 条件独立:若在给定Z的情况下,X与Y条件独立,则 给定Y,不会对X增加任何信息 一旦已知Z,Y不会对X提供额外的信息 例:

联合概率 联合概率: 如果这些变量是独立的,则 定义了所有可能状态的概率 二值变量的情况下有 项 用 个独立变量表示 二值变量的情况下有 项 用 个独立变量表示 非二值变量? 如果这些变量是独立的,则 对二值变量,用n个独立变量表示

联合概率 若有些变量是条件独立的话,联合概率可以用少于 个变量表示 例: 真实问题通常是这样的,贝叶斯网络就是利用了条件独立的性质 若有些变量是条件独立的话,联合概率可以用少于 个变量表示 例: 但若Y和W 在给定X下独立,且Z和W、X在给定Y下独立,则 真实问题通常是这样的,贝叶斯网络就是利用了条件独立的性质

链规则推广 条件概率的定义 递归定义: 2n 1 2 4 2n-1 对二值变量

多元随机向量的分布 令随机向量 ,其中 为随机变量,用 表示X的pdf/pmf,先前讨论的关于二元随机向量分布的结论都可以推广到多元随机向量,如可以定义边缘分布、条件分布等 当随机向量 互相独立时, 随机向量相互独立两两独立,但反之不成立

IID(Independent Identically Distribution)样本 当 互相独立且有相同的边缘分布F时,记为 ,我们称 为独立同分布( Independent Identically Distribution, IID)样本,表示 是从相同分布独立抽样/采样,我们也称 是分布F的随机样本。若F有密度f,也可记为 ,样本大小为n 思考题:怎样对任意分布F进行采样(得到多个独立同分布的样本)?

常见多元分布 多元二项分布 多元正态分布

多元二项分布 二项分布的多元变量版本 其中 例:从箱子中共k中颜色的球, 为抽取到颜色j的概率,共抽取n次,令 为颜色j出现的次数,则

多元二项分布 边缘分布:若 , 其中 且 ,则 的边缘分布为

多元正态分布 令 ,其中 且互相独立 则 Z的协方差矩阵为单位矩阵I,记为 。

多元正态分布 更一般地, 其中 表示矩阵的行列式, 为均值向量,协方差矩阵 为一个对称的正定矩阵

多元正态分布 多元正态分布有如下性质: 1、若 且 ,则 2、若 ,则 3、若 ,a为与X相同长度的向量,则

随机向量的变换 令 ,求 1. 对每个z,计算集合 2. 计算CDF 3. PDF为 例 2.48

随机向量的变换 令集合 集合 且A、B存在一一映射时,可利用Jacobian方法计算 定义反变换 ,变换的Jacobian为 (U,V)的联合分布为 思考题:求两个正态分布的和与乘积的分布

下节课内容 作业: 下节课内容 Chp2:第4、7、14、15题 期望、方差 样本均值、样本方差 层次模型 补充教材 [CB]p162-168