第一部分:概率 对应教材Chp1-5 课堂上讲述会较快,将知识点串起来,建议大家通读教材 主要内容: 随机变量及其分布

Slides:



Advertisements
Similar presentations
第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
Advertisements

2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
第二章 随机变量及其分布 在第一章里,我们研究了随机事件及其概率.而对于一个随机试验,我们除了对某些特定的事件发生的概率感兴趣外,往往还会关心某个与试验结果相联系的变量.由于这一变量依赖于试验结果,因而这一变量的取值具有随机性,这种变量被称为随机变量.本章将着重介绍两类随机变量——离散型随机变量和连续型随机变量及其分布.
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
第二章:随机变量 上节课内容 本节课内容 概率理论 随机变量及其分布 随机变量变换 常见分布族 多元随机向量的分布 概率公理及推论
概率论与数理统计 课件制作:应用数学系 概率统计课程组.
第四章 概率、正态分布、常用统计分布.
第三章 函数逼近 — 最佳平方逼近.
第三节 协方差及相关系数 协方差 相关系数 课堂练习 小结 布置作业.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
主要内容 § 3.1 多维随机变量及联合分布 联合分布函里数 联合分布律 联合概率密度 § 3.2 二维随机变量的边缘分布
本讲义可在网址 或 ftp://math.shekou.com 下载
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
1.2 事件的频率与概率 一、事件的频率 二、概率的公理化体系 1.2 事件的频率与概率.
3.解:连续掷同一枚硬币4次的基本事件总数为 ,
第四章 随机变量的数字特征 第一节 数学期望 第二节 方差 第三节 协方差及相关系数 第四节 矩、协方差矩阵.
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
全国高校数学微课程教学设计竞赛 知识点名称: 导数的定义.
第五章:随机变量的收敛性 随机样本:IID样本 , 统计量:对随机样本的概括 收敛性:当样本数量n趋向无穷大时,统计量的变化
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
EM算法 一种参数估计的方法.
数据统计与分析 秦 猛 南京大学物理系 手机: 第十讲 数据统计与分析 秦 猛 南京大学物理系 办公室:唐仲英楼A 手机:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第八模块 复变函数 第二节 复变函数的极限与连续性 一、复变函数的概念 二、复变函数的极限 二、复变函数的连续性.
连续型随机变量及其概率密度 一、概率密度的概念与性质 二、常见连续型随机变量的分布 三、小结.
第七章 参数估计 7.3 参数的区间估计.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
第三章:期望 上节课内容 本节课内容 随机变量及其分布 随机变量变换的分布 常见分布族 多元随机向量的分布:联合分布、边缘分布、条件分布
概 率 统 计 主讲教师 叶宏 山东大学数学院.
应用概率统计 主讲:刘剑平.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
第5章 大数定律和中心极限定理 5.1 大数定律 5.2 中心极限定理.
复习.
第十章 双线性型 Bilinear Form 厦门大学数学科学学院 网址: gdjpkc.xmu.edu.cn
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第一节 不定积分的概念与性质 一、原函数与不定积分的概念 二、不定积分的几何意义 三、基本积分表 四、不定积分的性质 五、小结 思考题.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
多层循环 Private Sub Command1_Click() Dim i As Integer, j As Integer
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第三章 多维随机变量及其分布 第一节 二维随机变量 第二节 边缘分布 第三节 条件分布 第四节 相互独立的随机变量
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第 四 章 大 数 定 理 与 中 心 极 限 定 理.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
正弦、余弦函数的性质 华容一中 伍立华 2017年2月24日.
§2 方阵的特征值与特征向量.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
定义 设连续型随机变量 概率密度为 分布函数是 特别地, 其概率密度为 一、正态分布的相关内容:.
难点:连续变量函数分布与二维连续变量分布
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
§4.1数学期望.
第3讲 概率论初步 3.1 概率 条件概率和加法公式 3.3 计数原则.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
Cfc Zeilberger 算法 陈焕林 陈永川 付梅 臧经涛 2009年7月29日.
Presentation transcript:

第一部分:概率 对应教材Chp1-5 课堂上讲述会较快,将知识点串起来,建议大家通读教材 主要内容: 随机变量及其分布 独立、条件独立、贝叶斯公式 期望、方差 概率不等式及收敛性

概率和随机变量 什么是“数据”(Data)? 什么是“模型”(Model)?

样本空间和事件 考虑一个事先不知道输入的试验: 试验的样本空间:所有可能输出 的集合 事件A是样本空间 的子集 试验的样本空间:所有可能输出 的集合 如果抛掷两次硬币,则样本空间为 事件A是样本空间 的子集 上述试验中第一次正面向上的事件为

从上述三个公理,可推导出概率的所有的其他性质。 对每个事件A ,我们定义一个数字P(A) ,称为A 的概率。概率根据下述三条公理: 1、事件A 的概率是一个非负实数:P(A) ≥ 0 2、合法命题的概率为1:P( ) = 1 3、对两两不相交(互斥)事件A1, A2, …, 从上述三个公理,可推导出概率的所有的其他性质。

公理的推论 不可满足命题的概率为0 对任意两个事件A 、 B 对事件A的补事件Ac 对任意事件A P (∅) = 0 P(A ∩ Ac) = 0 对任意两个事件A 、 B P(A ∪ B) = P (A) + P(B) – P(A ∩ B ) 对事件A的补事件Ac P(Ac) = 1 – P(A) 对任意事件A 0 ≤ P(A) ≤ 1

随机变量 随机变量是一个映射 ,将一个实数值 赋给一个试验的每一个输出 随机变量是一个映射 ,将一个实数值 赋给一个试验的每一个输出 例2.2:抛10次硬币,令X(ω)表示序列ω中正面向上的次数,如当 ω = HHTHHTHHTT,则 X(ω) = 6。 例2.3:令 表示单位圆盘,输出为该圆盘中的一点 ,则有随机变量:

数据和统计量 数据是随机变量的具体值 统计量是数据/随机变量的任何函数 任何随机变量的函数仍然是随机变量

分布函数 令X为一随机变量, x为X的一具体值,则随机变量X的累积分布函数 (cumulative distribution function, CDF) 定义为 CDF是一个非常有用的函数:包含了随机变量的所有信息。 CDF的性质:略 (见书) 有时记为F

例:随机变量的CDF CDF 例2.6:公正地抛硬币2次,令X表示正面向上的次数,则 右连续、非减函数 对所有实数x都有定义 虽然随机变量只取0、1、2

概率函数 离散型随机变量的概率函数 (probability function or probability mass function, pmf)定义为 对所有的 CDF与pmf之间的关系为: 有时记为 f

例:离散型随机变量的pmf 例2.10:公正地抛硬币2次,令X表示正面向上的次数,则 概率函数为:

概率(密度)函数 对连续型随机变量X,如果存在一个函数 ,使得对所有的x, ,且对任意 有 则函数 被称为概率密度函数 (probability density function, pdf)。 CDF与pdf之间的关系: 在所有 可微的点x,则 注意: 是可能的

例:连续型随机变量的CDF和pmf 例2.12:设X有PDF: 显然有 有该密度的随机变量为(0,1)上的均匀分布:Uniform(0, 1),即在0和1之间随机选择一个点。 其CDF为:

常见分布族 离散型随机变量 [2.3节] 连续型随机变量 [2.4节] 均匀(Uniform)分布 贝努利(Bernoulli)分布 二项(Binnomial)分布 超几何(HyperGeometric)分布 几何(Geometric)分布 泊松(Possion)分布 连续型随机变量 [2.4节] 正态(Normal)分布 Gamma分布 Beta分布 分布 指数(Exponential)分布

常用离散分布 例Binomial分布:X为一次抛硬币的输出, 则我们说

常用连续分布 例均匀分布:

正态分布 高斯分布/正态分布: 在实际遇到的许多随机现象都服从或近似服从正态分布 中心极限定理:随机样本的均值近似服从正态分布 最重要的分布之一 在实际遇到的许多随机现象都服从或近似服从正态分布 如考试成绩 中心极限定理:随机样本的均值近似服从正态分布 对任意IID样本 ,则

标准正态分布 当 时,正态分布称为标准正态分布,通常用Z表示服从标准正态分布的变量,记为 。 标准化: pdf和CDF分别记为 标准化: 若 ,则 正态分布的线性组合仍是正态分布:若 是独立的,则

多元随机向量的分布 我们可以在多个随机变量组成的向量上定义分布,我们称之为多元随机向量的分布。 统计学习中我们的数据集通常由多元随机向量分布的样本组成。每一列为一个随机变量,也可以将整个随机向量看成一个随机变量。

边缘分布 离散型随机变量:

边缘分布 连续型随机变量: 联合分布包含了随机向量概率分布的信息 联合分布唯一确定了边缘分布,但反之通常不成立

独立 PDF可以因式分解

随机变量之间的关系 独立 当且仅当 不独立:随机变量之间的关系用条件分布描述 条件分布: 

联合分布、边缘分布与条件分布 边缘分布与联合分布: 条件分布与边缘分布、联合分布: 联合分布与条件分布、边缘分布:

贝叶斯规则 如果X可以取值 ,y为Y的一个取值, 因此,有贝叶斯规则 连续情况: 似然 先验 后验

多元随机向量的分布 令随机向量 ,其中 为随机变量,用 表示X的pdf/pmf,先前讨论的关于二元随机向量分布的结论都可以推广到多元随机向量,如可以定义边缘分布、条件分布等 当随机向量 互相独立时, 随机向量相互独立两两独立,但反之不成立

IID(Independent Identically Distribution)样本 当 互相独立且有相同的边缘分布F时,记为 ,我们称 为独立同分布( Independent Identically Distribution, IID)样本,表示 是从相同分布独立抽样/采样,我们也称 是分布F的随机样本。若F有密度f,也可记为 ,样本大小为n 思考题:怎样对任意分布F进行采样(得到多个独立同分布的样本)?

期望 期望/均值:随机变量的平均值 概率加权平均 宏观物理量是微观物理量的统计平均值

期望 期望是随机变量的一个很好单值概述:随机变量典型的值或期望值 大数定律(Chp5):当有大量独立同分布(Independed Identical Distribution, IID) 样本 时,期望 可视为样本均值 当 ,我们说 是良好定义的(well defined);否则我们说期望不存在。

期望 [最小距离] 假设我们用L2距离度量一个随机变量X与一个常数b的距离,即 。b离X越近,这个量就越小。因此我们可以确定b的值,使得 最小,b可认为是X的一个很好预测。(不能直接最小化 因为结果与X有关,对X的预测无用) 问题:如果采用L1作为距离度量呢? 注意: 是常数

期望的性质 线性运算: 加法规则: 乘法规则:

分位函数 (quantile function) 令随机变量X的CDF为F,CDF的反函数或分位函数(quantile function)定义为 其中 。若F严格递增并且连续,则 为一个唯一确定的实数x,使得 。 为增函数 中值(median): 一个很有用的统计量,对噪声比较鲁棒

众数(mode) 众数:设随机变量X有密度 ,且存在 满足 ,则称 为X的众数。 期望、中位数和众数都称为位置参数。 随机变量出现次数最多的位置 期望、中位数和众数都称为位置参数。 当随机变量的分布为高斯分布时,三者相等

方差 方差:刻画随机变量围绕均值的散布程度 方差越大,X变化越大;方差越小,X与 越接近 方差:二阶中心矩

方差的性质 注意:期望的加法规则无需独立条件 不独立随机变量和的方差计算需考虑变量之间的协方差

样本均值和方差 令 为IID,样本均值定义为 样本方差定义为

样本均值和方差 和 分别为 和 的很好估计(无偏估计)

协方差(covariance) /相关系数 协方差/相关系数:刻画两个随机变量之间关系强弱

协方差(covariance) /相关系数 X、Y独立,则X、Y 不相关: 但反过来不成立!

协方差的性质 对任意两个随机变量X和Y,有 当X、Y独立时: 推广到多个随机变量:

方差-协方差矩阵 令随机向量 的形式为: 则 的方差—协方差矩阵 为 当个成分变量独立时,协方差矩阵是什么样子呢?

相关(correlation) 相关:度量两个变量之间的线性相关程度 若  变量之间不线性相关 独立意味着不相关 但反过来不成立! 当 时,  变量之间不线性相关 独立意味着不相关 但反过来不成立! 非线性相关,但可能高阶相关

作业1 Chp3:第19题 编程环境: 作业上交方式两周后通知 Matlab:提供很多基本基础函数和工具,对理解算法的基本思想很有帮助,编程快捷 VC:实际系统中的算法一般采用C/C++实现 你喜欢的任何编程语言 作业上交方式两周后通知

其他内容 随机变量的变换的分布 条件分布、条件独立 条件期望、条件方差

下节课内容 概率不等式(Chp4 )