概率统计与随机过程 宋 晖 – 2013年秋.

Slides:



Advertisements
Similar presentations
第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
Advertisements

一、 一阶线性微分方程及其解法 二、 一阶线性微分方程的简单应用 三、 小结及作业 §6.2 一阶线性微分方程.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
非线性时间序列模型 一般非线性时间序列模型介绍 条件异方差模型 上海财经大学 统计与管理学院.
07/16/96 概率统计 自考辅导.
第一节 数理统计的基本概念.
第六章 样本及抽样分布 简单随机抽样: 代表性: 中每一个与所考察的总 体有相同的分布。 2.独立性: 是相互独立的随机变量。
引言 我们已介绍了总体、样本、简单随机样本、统计量和抽样分布的概念,介绍了统计中常用的三大分布,给出了几个重要的抽样分布定理. 它们是进一步学习统计推断的基础.
第二部分:统计推断 Chp6:统计推断概述 Chp7:非参数推断 Chp8:Bootstrap Chp9:参数推断 Chp10:假设检验
第三章 多元正态分布 §3.1 多元正态分布的定义 §3.2 多元正态分布的性质 §3.3 极大似然估计及估计量的性质
第四章 概率、正态分布、常用统计分布.
第三章 函数逼近 — 最佳平方逼近.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
08-09冬季学期 概率论与数理统计 姜旭峰,胡玉磊.
《高等数学》(理学) 常数项级数的概念 袁安锋
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
本讲义可在网址 或 ftp://math.shekou.com 下载
不确定度的传递与合成 间接测量结果不确定度的评估
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
区间估计 Interval Estimation.
Introduction To Mean Shift
第6章 统计量及其抽样分布 统计量 关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
一元线性回归模型 § 1 回归分析概述 § 2 一元线性回归模型的参数估计 § 3 一元线性回归模型的统计检验
第三章:统计信号估计 3.1 问题描述 3.2 随机参量的Bayes估计 3.3 ML估计 3.4 估计量的性质
第2章 一元线性回归 2 .1 一元线性回归模型 2 .2 参数 的估计 2 .3 最小二乘估计的性质 2 .4 回归方程的显著性检验
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
计算机数学基础 主讲老师: 邓辉文.
EM算法 一种参数估计的方法.
第十章 方差分析.
第六章 数理统计的基本知识 第一节 总体与样本
数据统计与分析 秦 猛 南京大学物理系 手机: 第十讲 数据统计与分析 秦 猛 南京大学物理系 办公室:唐仲英楼A 手机:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第七章 参数估计 7.3 参数的区间估计.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
Chp9:参数推断 主要内容 参数推断的基本概念 参数推断的方法 矩方法
3.8.1 代数法计算终点误差 终点误差公式和终点误差图及其应用 3.8 酸碱滴定的终点误差
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
第七章 参数估计 主讲教师:董庆宽 副教授 研究方向:密码学与信息安全
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第三章 两变量线性回归.
学习任务三 偏导数 结合一元函数的导数学习二元函数的偏导数是非常有用的. 要求了解二元函数的偏导数的定义, 掌握二元函数偏导数的计算.
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
数据统计与分析 秦 猛 南京大学物理系 第11讲 办公室:唐仲英楼A
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
概率论与数理统计B.
第六章 参数估计 §6.1 点估计的几种方法 §6.2 点估计的评价标准 §6.3 最小方差无偏估计 §6.4 贝叶斯估计
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第二节 简单线性回归模型的最小二乘估计 用样本去估计总体回归函数,总要使用特定的方法,而任何估 计参数的方法都需要有一定的前提条件——假定条件 一、简单线性回归的基本假定 为什么要作基本假定? ●只有具备一定的假定条件,所作出的估计才具有良好的统计性质。 ●模型中有随机扰动项,估计的参数是随机变量,显然参数估计值的分布与扰动项的分布有关,只有对随机扰动的分布作出假定,才能比较方便地确定所估计参数的分布性质,也才可能进行假设检验和区间估计等统计推断。
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
数理统计基本知识.
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
本节课内容 MLE的性质 MLE很流行是因为MLE有一些很好的性质.
参数估计 参数估计问题:知道随机变量(总体)的分布类型, 但确切的形式不知道,根据样本来估计总体的参数,这 类问题称为参数估计。
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
贝叶斯估计 Bayes Estimation
数学模型实验课(二) 最小二乘法与直线拟合.
第6章 数理统计基础 §6.1 数理统计的几个基本概念 §6.2 描述统计 §6.3 抽样分布.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
Presentation transcript:

概率统计与随机过程 宋 晖 – 2013年秋

第一章 概率统计基础 抽样估计 常用统计量 常用统计分布

抽样分布 统计推断从样本中推断总体 统计量的概率分布称为抽样分布 例:依据 的抽样分布对参数 做出推断 主要目标:归纳和预测 总体大小 样本容量 选择样本的方法 例:依据 的抽样分布对参数 做出推断

重要统计量 统计量:由随机变量组成的一随机样本的函数,不含任何未知参数 样本均值,描述样本中心趋势 样本方差,描述样本的波动性 n阶原点矩

均值的抽样分布 样本容量为n的 的抽样分布 n个随机样本来自~N(μ,σ2)总体 实验不断重复(样本容量为n),产生多次的值时的一个分布 描述样本在总体均值μ附近的平均变化 n个随机样本来自~N(μ,σ2)总体 ~ N(μ,σ2/n)

S2的抽样分布 S2统计量 引入:

分布 所服从的分布为自由度为n的卡方分布,也就是Γ(n/2, ½)分布,其密度函数为: 定义: X1, X2,…,Xn i.i.d, ~ N(0,1), 随机变量 所服从的分布为自由度为n的卡方分布,也就是Γ(n/2, ½)分布,其密度函数为: n=1 n=4 n=10 n=15

卡方分布特性 自由度为n的卡方分布:μ = n, σ2=2n 卡方分布的可加性 推论: X1, X2,…,Xn i.i.d, ~ N(μ, σ2), 随机变量 服从自由度为n的卡方分布。

Fisher(费歇尔)定理 如果S2是{xi} ~ N(μ, σ2)的样本方差统计量,且 与 S2 相互独立 则随机变量

μ 的估计 样本统计量 实际中σ 值未知,已知量为 S 考察统计量: 引入t分布

t分布(学生氏分布) 定义: X~ N(0,1), Y ~Х2(n),且X与Y相互独立,称随机变量 所服从的分布为自由度为n的t分布,t ~ t(n) 密度函数为:

t分布特性 n=1时,E(t)不存在 n≥2时,E(t) =0 n→∞时(n ≥ 45),t分布趋向于标准正态分布 n=60 n=10

结论: X1, X2,…,Xn i.i.d, ~ N(μ, σ2), 随机变量 为符合自由度为n-1的t分布。 t分布被大量用于总体均值的推断、样本比较等问题上

F分布(方差比分布) 定义: X ~Х2(n), Y ~Х2(m),且X与Y相互独立,称随机变量 所服从的分布为自由度为(n,m)的F分布, F ~ F(n,m)

F分布的密度函数 (60,10) 用于比较多种类型的样本方差问题,如:比较样本是否来源于不同总体 (10,10) (5,10) (1,10)

分布的分位数 在统计推断时,需要知道给定概率下,对应随机变量的取值。 定义:设X是随机变量,0<α<1,若实数Z α 满足 则称Zα为X的α分位点。 α Zα α分位点可以由分布表查得

第二章 样本估计 抽样估计 点估计 极大似然估计 最小二乘法 区间估计

统计推断 主要方法 估计 假设检验 经典方法和贝叶斯方法 例1:通过随机抽样的100名投票者的意见来估计支持某位候选人的投票者的比例 例2:通过随机抽样,估计整批产品的次品率 假设检验 例:假设A的支持率比B高,通过适当的检验后,验证推翻这个假设

点估计方法 要求 估计的“误差”应较小 当 n 较大时,估计的“精度”应较高 矩估计法 极大似然估计法 最小二乘估计法 常用的点估计:

极大似然估计 例:分类问题,样本x属于A类的概率是90%,属于B类的概率是5%。当观察到样本x时,x属于哪一类? Fisher极大似然估计 极大似然估计 基本思想:一个随机试验有很多可能结果,如果在一次试验中,某结果发生了,则认为该结果(事件)发生的可能性最大。 例:分类问题,样本x属于A类的概率是90%,属于B类的概率是5%。当观察到样本x时,x属于哪一类? 分析:按照 Fisher 的极大似然思想,应该认为是x属于A类较合理。

定义:设 是总体 的样本, 令 称 为似然函数 若存在统计量 使得: 则称 为 的极大似然估计, 简记为MLE 定义:设 是总体 的样本, 令 称 为似然函数 若存在统计量 使得: 则称 为 的极大似然估计, 简记为MLE Maximum Likelihood Estimation

估计量的评选标准 均值估计:选择样本均值还是中位数? 选择标准: 无偏性标准 、有效性标准 定义:若估计量 的数学期望 存在,且 有 存在,且 有 则称 为θ 的无偏估计,否则称为有偏估计。 称: 为估计量 的偏差

有偏估计, N → ∞,渐进无偏,偏差可以忽略 样本 {xi} ~ N(μ, σ2) 样本均值 ,样本方差 极大似然估计 μML = , 可以证明: ,S2 是无偏估计 μML 、σ2ML 本身符合高斯分布 无偏估计 有偏估计, N → ∞,渐进无偏,偏差可以忽略

有效估计 定义:某种参数θ所有可能的无偏估计量,其中方差最小的估计量是θ的最有效估计量 θ的三个估计量中, θ1和θ2是无偏的, θ1的方差小于θ2的方差,因此更有效。

作业 1. 证明:自由度为n的卡方分布~Γ(n/2, ½)分布 2. 证明统计量样本均值、样本方差分别是μ, σ2的无偏估计 3. 根据所给的资料,学习掌握常用分布(正态分布、卡方分布、t分布和F分布)的绘制方法

回归(Regression)问题 Fit the data using a polynomial function y(x, w) is a nonlinear function of x It is a linear function of the coefficients w 可以转化为多元线性回归问题求解

确定参数 最小二乘法:计算值与观测值之间的误差的平方最小 误差函数 The error function corresponds to (one half of) the sum of the squares of the displacements (shown by the vertical green bars) of each data point from the function y(x,w).. 残差图

一元线性函数 t = w0+w1x min

Gaussian(1777-1855) 最重要贡献:《算术研究》 数学王子,数学成就比肩牛顿、阿基米德 德国著名数学家、物理学家、天文学家、大地测量学家 高斯的成就遍及数学的各个领域,在数论、非欧几何、微分几何、超几何级数、复变函数论以及椭圆函数论等方面均有开创性贡献。他十分注重数学的应用,并且在对天文学、大地测量学和磁学的研究中也偏重于用数学方法进行研究。 最重要贡献:《算术研究》

费歇尔 Fisher,Ronald Aylmer(1890.2.17~1962.7.29) 英国统计与遗传学家,现代统计科学的奠基人之一。 在遗传学的研究中,不断发展其变异数分析理论,他在1925所著《研究工作者的统计方法》影响力超过半世纪,遍及全世界。 巨著《天择的遗传理论》说明孟德尔的遗传定律与达尔文的理论相辅相成,认为演化的驱力主要来自选择的因素远重於突变的因素。这本著作将统计分析的方法带入演化论的研究,为解释现代生物学的核心理论打下坚实的基础。 返回