数理统计基本知识.

Slides:



Advertisements
Similar presentations
第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
Advertisements

全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
第二章 随机变量及其分布 在第一章里,我们研究了随机事件及其概率.而对于一个随机试验,我们除了对某些特定的事件发生的概率感兴趣外,往往还会关心某个与试验结果相联系的变量.由于这一变量依赖于试验结果,因而这一变量的取值具有随机性,这种变量被称为随机变量.本章将着重介绍两类随机变量——离散型随机变量和连续型随机变量及其分布.
第一节 数理统计的基本概念.
概率论与数理统计 课件制作:应用数学系 概率统计课程组.
第四章 概率、正态分布、常用统计分布.
第三章 函数逼近 — 最佳平方逼近.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
概率论与 数理统计 高教自考复习 总第十四讲.
08-09冬季学期 概率论与数理统计 姜旭峰,胡玉磊.
例题 教学目的: 微积分基本公式 教学重点: 牛顿----莱布尼兹公式 教学难点: 变上限积分的性质与应用.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
一、原函数与不定积分 二、不定积分的几何意义 三、基本积分公式及积分法则 四、牛顿—莱布尼兹公式 五、小结
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
主要内容 § 3.1 多维随机变量及联合分布 联合分布函里数 联合分布律 联合概率密度 § 3.2 二维随机变量的边缘分布
本讲义可在网址 或 ftp://math.shekou.com 下载
不确定度的传递与合成 间接测量结果不确定度的评估
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
2-7、函数的微分 教学要求 教学要点.
区间估计 Interval Estimation.
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
第6章 统计量及其抽样分布 统计量 关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
计算机数学基础 主讲老师: 邓辉文.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第一章 函数 函数 — 研究对象—第一章 分析基础 极限 — 研究方法—第二章 连续 — 研究桥梁—第二章.
第十章 方差分析.
第六章 数理统计的基本知识 第一节 总体与样本
第五章 统计量及其分布 §5.1 总体与样本 §5.2 样本数据的整理与显示 §5.3 统计量及其分布 §5.4 三大抽样分布
数据统计与分析 秦 猛 南京大学物理系 手机: 第十讲 数据统计与分析 秦 猛 南京大学物理系 办公室:唐仲英楼A 手机:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
连续型随机变量及其概率密度 一、概率密度的概念与性质 二、常见连续型随机变量的分布 三、小结.
第七章 参数估计 7.3 参数的区间估计.
导数的应用 ——函数的单调性与极值.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
数列.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
概 率 统 计 主讲教师 叶宏 山东大学数学院.
应用概率统计 主讲:刘剑平.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
复习.
第十章 双线性型 Bilinear Form 厦门大学数学科学学院 网址: gdjpkc.xmu.edu.cn
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
定理21.9(可满足性定理)设A是P(Y)的协调子集,则存在P(Y)的解释域U和项解释,使得赋值函数v(A){1}。
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
第三章 随机变量的数字特征 (一)基本内容 一、一维随机变量的数学期望 定义1:设X是一离散型随机变量,其分布列为:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第三章 函数的微分学 第二节 导数的四则运算法则 一、导数的四则运算 二、偏导数的求法.
第三章 多维随机变量及其分布 第一节 二维随机变量 第二节 边缘分布 第三节 条件分布 第四节 相互独立的随机变量
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
数据统计与分析 秦 猛 南京大学物理系 第11讲 办公室:唐仲英楼A
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第 四 章 大 数 定 理 与 中 心 极 限 定 理.
定义 设连续型随机变量 概率密度为 分布函数是 特别地, 其概率密度为 一、正态分布的相关内容:.
难点:连续变量函数分布与二维连续变量分布
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第三节 函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.
第五章 数理统计的基本知识 §5.1 总体与样本.
第八章 假设检验 8.3 两个正态总体参数的假设检验.
参数估计 参数估计问题:知道随机变量(总体)的分布类型, 但确切的形式不知道,根据样本来估计总体的参数,这 类问题称为参数估计。
数理统计部分 数理统计主要内容 第六章 样本及抽样分布 第七章 参数估计 第八章 假设检验
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
第6章 数理统计基础 §6.1 数理统计的几个基本概念 §6.2 描述统计 §6.3 抽样分布.
Presentation transcript:

数理统计基本知识

随机变量及其概率分布全面描述了随机现象的统计 性规律。概率论的许多问题中,随机变量的概率分布通常 是已知的,或者假设是已知的,而一切计算与推理都是在 这个基础上得出来的。 但实际中,情况往往并非如此,随机变量所服从的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些参数是未知的。 某公路上行驶车辆的速度服从什么分布是未知的; 电视机的使用寿命服从什么分布是未知的; 产品是否合格服从两点分布,但参数——合格率p未知;

数理统计学是一门关于数据收集、整理、分析和推断的 科学。 数理统计的任务则是以概率论为基础,根据试验所得到 的数据,对研究对象的客观统计规律性做出合理的推断。 以样本的信息来推断总体的信息,是数理统计学研究的 重要问题。

总体 研究对象的全体称为总体。组成总体的每个研究对象 称为个体。 抽样 要了解总体的分布规律,在统计分析工作中,往往需 从总体中抽取一部分个体进行观测,这个过程称为抽样。

样本 在抽取过程中,每抽取一个个体,就是对总体X 进行一次随机试验,每次抽取的n个个体 称为总体X的一个样本。 样本中所包含的个体数量称为样本容量。 样本 是n个随机变量,抽取之后 的观测数据 称为样本观察值或样本值。

随机抽样方法的基本要求 代表性——即样本( )的每个分量 与总体 具有相同的概率分布。 独立性——即每次抽样的结果既不影响其余各次抽样的 代表性——即样本( )的每个分量 与总体 具有相同的概率分布。 独立性——即每次抽样的结果既不影响其余各次抽样的 结果,也不受其它各次抽样结果的影响。 满足上述两点要求的样本称为简单随机样本. 获得简单随机样本的抽样方法叫简单随机抽样.

简单随机抽样 例如:要通过随机抽样了解一批产品的次品率, 如果每次抽取一件产品观测后放回原来的总量中,则 这是一个简单随机抽样。 但实际抽样中,往往是不再放回产品,则这不是一个简单随机抽样。但当总量N很大时,可近似看成是简单随机抽样。

设总体X具有分布函数F(x), X1, X2, …, Xn 为 取自该总体的样本,则样本联合分布函数为 则样本的联合密度函数为 对于离散型总体X,设其概率函数为P(X=x) =p(x), 则样本的联合概率函数为

统计量 完全由样本决定的量称为统计量,它只依赖于样本,不依赖于任何未知参数. 例如: 设 是从正态总体 中抽取 例如: 设 是从正态总体 中抽取 的一个样本,其中 为已知参数, 为未知参数, 则 是统计量 不是统计量

几个常用的统计量 设 是总体 的一个样本, 样本均值 样本方差 样本均方差或样本标准差

设 是总体 的一个样本, 样本的K阶原点矩 样本的K阶中心矩 样本的2阶中心矩

X(i) 称为该样本的第i 个顺序统计量,它的取值 是将样本观测值由小到大排列后得到的第 i 个 设 X1, X2, …, Xn 是取自总体X的样本, X(i) 称为该样本的第i 个顺序统计量,它的取值 是将样本观测值由小到大排列后得到的第 i 个 观测值。其中X(1)=minX1, X2,…, Xn称为该样本 的最小顺序统计量,称 X(n)=maxX1,X2,…,Xn为 该样本的最大顺序统计量。称R= x(n) -x(1)为极差 样本中位数

设 X1,X, …, Xn 是取自总体分布函数为F(x)的样本,若将样本观测值由小到大进行排列,为 x(1), x(2), …, x(n),则称 x(1), x(2), …, x(n) 为有序样本, 用有序样本定义如下函数 则Fn(x)是一非减右连续函数,且满足 Fn() = 0 和 Fn() = 1 则Fn(x)是一个分布函数,称Fn(x)为经验分布函数。

例 某食品厂生产听装饮料,现从生产线上 随机抽取5听饮料,称得其净重(单位:克) 351 347 355 344 351 这是一个容量为5的样本,经排序可得有序样本: x(1)= 344, x(2)= 347, x(3)= 351, x(4)= 354, x(5)= 355 其经验分布函数为

格里纹科定理 设X1,X2,…,Xn是取自总体分布函数为F(x)的样本, Fn(x) 是其经验分布函数。则对任意>0,当n时,有 PFn(x)  F(x) = 1 当n 相当大时,经验分布函数是总体分布函数F(x)的一个良好的近似。经典的统计学中一切统计推断都以样本为依据,其理由就在于此。

三大统计分布

c2分布 设(X1,X2,…,Xn)相互独立, 且都服从标准正态分布N (0,1),则称 服从自由度为n的c2分布, 记为

Xi~N( , 2)且X1,X2,…,Xn相互独立,则 性质 设(X1,X2,…,Xn)为取自正态总体X~N( , 2) 的样本,则 证明 Xi~N( , 2)且X1,X2,…,Xn相互独立,则 且各 相互独立,

例 设总体 为总体X 的样本, 试确定常数 c , 使 cY 服从 分布. 解

2分布的数学期望与方差 设X~ 2(n),则E(X)=n,D(X)=2n. 2分布的可加性 设 且X与Y相互独立, 则

分位数  x o y x 对X和给定的 (0<<1),若存在x, 则称x为X的分布的上侧分位数 使P{X≥x} =, 对X和给定的 (0<<1),若存在x, 则称x为X的分布的上侧分位数  x o y x

u0.05 =1.645. 标准正态分布的上侧分位数u P{U<u} =1- (u) =1- (x) x O u  P{U≥1.645} =0.05

2分布的上侧分位数 fn(x) x O  当n不太大时,可查附表3; 当n比较大时; 例如,

据林德伯格-莱维中心极限定理,当 时 由性质

t分布 t 分布的数学期望与方差 设随机变量X~N(0,1),Y~ 2(n) ,且X与Y相互独立,则称统计量 服从自由度为n的t分布,记为 设T~t (n),则E(T)=0,D(T)=

t分布的上侧分位数t(n) t t(n)  t1- (n) t(n)=-t1- (n) f(t) O 当n较小时,可查表; t(n)≈u

F分布 F~F(n1,n2). 设随机变量X~ 2(n1),Y~ 2(n2),且相互独 立,则称随机变量 服从第一自由度为n1,第二自由度为n2的F分布, 记作 F~F(n1,n2). 性质1 若F~F(n1,n2),则 ~F(n2,n1).

U2~2(1), ~ F(1, n). 例 若T~t(n), 问T2服从什么分布? 解 因为T~t(n), 可以认为 其中U~N(0,1), V~2(n),且U,V独立 U2~2(1), ~ F(1, n).

F分布的上侧分位数F(n1,n2) f(x) x O  F(n1, n2) 值较小时,可查表; 当 较大时,可以由公式 得出

证明

抽样分布定理 设(X1,X2,…,Xn)为来自正态总体 X~N( , 2)的样本,则 (1) 样本均值 与样本方差S 2相互独立;(证明,略) (2) (证明,略) (3) (4)

例 设(X1,X2,…,Xn)为取自正态总体X~N( , 2) 的样本,则

例 设(X1,X2,…,Xn)为取自正态总体 的样本,(Y1,Y2,…,Ym)为取自正态总体 的样本。X与Y独立,则 的 则

证明 设(X1,X2,…,Xn)为来自正态总体 由于 与S 2相互独立,则U,V相互独立

且U,V相互独立, 由F分布的定义有 例 设 为正态总体 的样本容量和样本方差;设 为正态总体 的样本容量和样本方差。设两个总体相互独立,则 例 设 为正态总体 的样本容量和样本方差;设 为正态总体 的样本容量和样本方差。设两个总体相互独立,则 证明 且U,V相互独立, 由F分布的定义有

~t(2). Xi~N(0,1),i=1, 2, …, n.且相互独立 X1-X2 ~N(0, 2), 例 设总体X~N(0,1), X1,X2,…,Xn为简单随机样本,试问下列统计量各服从什么分布? Xi~N(0,1),i=1, 2, …, n.且相互独立 解 (1) X1-X2 ~N(0, 2), 且U,V相互独立 ~t(2).

~t(n-1). 例 设总体X~N(0,1), X1,X2,…,Xn为简单随机样本,试问下列统计量各服从什么分布? (2) 且U,X1相互独立 ~t(n-1).

~F(3,n-3). 例 设总体X~N(0,1), X1,X2,…,Xn为简单随机样本,试问下列统计量各服从什么分布? (3) 且U,V相互独立 ~F(3,n-3).

例 设总体X~N( , 42), X1,X2,…,X10是简单随机样本, S2为样本方差,已知P{S2>}=0.1,求 . 因为n=10,n-1=9, 2=42, 解 所以 ~2(9). 又 P{S2> }= =0.1, 所以 ≈14.684. 故  ≈26.105

例 从正态总体 中,抽取了 n = 20的样本 (1) 求 (2) 求 解 (1) 即

(2)

例 设X 与Y 相互独立,X ~ N(0,16),Y ~ N(0,9) , X1, X2 ,…, X9 与Y1, Y2 ,…, Y16分别是取自 X 与 Y 的简单随机样本, 求统计量 所服从的分布. 解 U,V相互独立