第六章 数理统计的基本知识 第一节 总体与样本

Slides:



Advertisements
Similar presentations
第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
Advertisements

第一节 不定积分的概念及其 计算法概述 一、原函数与不定积分的概念 二、基本积分表 三、不定积分的性质及简单计算 四、小结.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
第八章 第四节 机动 目录 上页 下页 返回 结束 一个方程所确定的隐函数 及其导数 隐函数的微分法.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
全微分 教学目的:全微分的有关概念和意义 教学重点:全微分的计算和应用 教学难点:全微分应用于近似计算.
练一练: 在数轴上画出表示下列各数的点, 并指出这些点相互间的关系: -6 , 6 , -3 , 3 , -1.5, 1.5.
第一节 数理统计的基本概念.
第五章 二次型. 第五章 二次型 知识点1---二次型及其矩阵表示 二次型的基本概念 1. 线性变换与合同矩阵 2.
第三章 函数逼近 — 最佳平方逼近.
第二章 二次函数 第二节 结识抛物线
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
08-09冬季学期 概率论与数理统计 姜旭峰,胡玉磊.
高等数学电子教案 第五章 定积分 第三节 微积分基本定理.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
第二节 微积分基本公式 1、问题的提出 2、积分上限函数及其导数 3、牛顿—莱布尼茨公式 4、小结.
定积分性质和微积分学基本定理 一、 定积分性质 二、 变上限积分函数 三、 定积分基本公式.
第四章 函数的积分学 第六节 微积分的基本公式 一、变上限定积分 二、微积分的基本公式.
微积分基本定理 2017/9/9.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
主要内容 § 3.1 多维随机变量及联合分布 联合分布函里数 联合分布律 联合概率密度 § 3.2 二维随机变量的边缘分布
本讲义可在网址 或 ftp://math.shekou.com 下载
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第5章 §5.3 定积分的积分法 换元积分法 不定积分 分部积分法 换元积分法 定积分 分部积分法.
复习引入 数据 统计学的核心思想是 根据样本的情况对总体的相应情况作出估计和推断 2.统计学研究问题的步骤
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
计算机数学基础 主讲老师: 邓辉文.
§2 求导法则 2.1 求导数的四则运算法则 下面分三部分加以证明, 并同时给出相应的推论和例题 .
第十章 方差分析.
数据统计与分析 秦 猛 南京大学物理系 手机: 第十讲 数据统计与分析 秦 猛 南京大学物理系 办公室:唐仲英楼A 手机:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第八模块 复变函数 第二节 复变函数的极限与连续性 一、复变函数的概念 二、复变函数的极限 二、复变函数的连续性.
第七章 参数估计 7.3 参数的区间估计.
第一章 函数与极限.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
数列.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
模型分类问题 Presented by 刘婷婷 苏琬琳.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第一节 不定积分的概念与性质 一、原函数与不定积分的概念 二、不定积分的几何意义 三、基本积分表 四、不定积分的性质 五、小结 思考题.
第4课时 绝对值.
第三章 多维随机变量及其分布 第一节 二维随机变量 第二节 边缘分布 第三节 条件分布 第四节 相互独立的随机变量
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
数据统计与分析 秦 猛 南京大学物理系 第11讲 办公室:唐仲英楼A
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
§2 方阵的特征值与特征向量.
难点:连续变量函数分布与二维连续变量分布
数理统计基本知识.
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第五章 数理统计的基本知识 §5.1 总体与样本.
参数估计 参数估计问题:知道随机变量(总体)的分布类型, 但确切的形式不知道,根据样本来估计总体的参数,这 类问题称为参数估计。
数理统计部分 数理统计主要内容 第六章 样本及抽样分布 第七章 参数估计 第八章 假设检验
定义5 把矩阵 A 的行换成同序数的列得到的矩阵,
第四节 向量的乘积 一、两向量的数量积 二、两向量的向量积.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
三角 三角 三角 函数 余弦函数的图象和性质.
第6章 数理统计基础 §6.1 数理统计的几个基本概念 §6.2 描述统计 §6.3 抽样分布.
§2 自由代数 定义19.7:设X是集合,G是一个T-代数,为X到G的函数,若对每个T-代数A和X到A的函数,都存在唯一的G到A的同态映射,使得=,则称G(更严格的说是(G,))是生成集X上的自由T-代数。X中的元素称为生成元。 A变, 变 变, 也变 对给定的 和A,是唯一的.
Presentation transcript:

第六章 数理统计的基本知识 第一节 总体与样本 第六章 数理统计的基本知识 数理统计是以概率论为基础,根据试验或观察得到的数据,来研究随机现象.通过统计分析,对研究对象的客观规律性作出合理的估计和推断. 第一节 总体与样本 在一个统计问题中,我们把所研究对象的全体称为一个总体.总体中的每个元素(即每一个研究对象)称为个体. 若总体中包含有限个个体,则称这个总体为有限总体,否则称为无限总体,总体中所包含的个体总数称为总体容量. 在统计问题中,人们所关心的往往不是总体的一切方面,而是它的某一项数量指标X.因此,我们把这个数量指标X所有可能取值的全体就作为总体看待,称为总体X,X是一个随机变量.我们要根据试验或观察得到的数据来得到X的概率分布和数字特征,分别称为总体的分布和数字特征.

大家知道,随机现象的统计规律性必然在大量的重复试验中呈现出来, 为了推断总体X 的性质,从理论上讲,应该对每个个体逐一进行测试,然而实际上这样做往往是不现实的,例如,要研究灯泡寿命,由于寿命测试是破坏性的,当测试过每只灯炮的寿命后,这批灯泡就报废了. 一般来说,恰当的方法是按一定的规则从总体中抽取若干个个体进行测试,为了使测试到的数据能很好地反映总体的情况,当然应该要求总体中每一个个体被抽到的可能性是均等的.并且在抽取一个个体后总体的成分不改变.这种抽取个体的方法称为简单随机抽样.被抽出的部分个体,叫做总体的一个样本. 假设我们从总体 X 中抽取 n 个个体进行测试(简单抽样),把测试结果分别记作X1,X2,…, Xn.由于抽样的随机性,Xi 可以取 X 所有可能的值,是与 X 具有相同分布的随机变量,且 X1,X2,…,Xn 相互独立.这样的 n 个个体称为总体 X 的一个简单随机样本.

定义 设 X 是具有某一概率分布的随机变量(看作一个总体).如果随机变量X1,X2,…, Xn 相互独立,且都与 X 具有相同的概率分布, 则称 n 维随机变量 (X1,X2,…,Xn) 为来自总体 X 的简单随机样本,简称样本,n 称为样本容量. 在对总体X进行一次具体的抽样并作观测之后,得到样本(X1,X2,…,Xn)的确切的数值(x1,x2,…,xn),称为一个样本观测值(观察值),简称样本值. 样本(X1,X2,…,Xn)所有可能取值的全体称为样本空间,它是n维空间或其中的一个子集.样本观察值(x1,x2,…,xn)是样本空间中的一个点. 如果总体 X 的分布函数为F(x),则 X 的样本 X1,X2,…,Xn 的联合分布函数为 . 如果总体 X 为连续型且概率密度为 f(x),则样本(X1,X2,…,Xn)的联合概率密度为 .

第二节 统计量及其分布 二、样本矩 一、统计量 第二节 统计量及其分布 一、统计量 样本是总体的代表,是统计推断的依据.在应用时,往往不是直接使用样本本身,而是针对不同的问题构造样本的函数,来进行统计推断. 定义1 设(X1,X2,…,Xn)是来自总体 X 的一个样本,t = g(t1, t2,…, tn) 为t1, t2, …, tn的一个单值实函数,并且其中不包含任何未知参数,则称 T = g(X1, X2, …, Xn)为一个统计量. 设 x1, x2,…, xn 是相应于样本 X1, X2, …,Xn 的样本值,则称 g(x1,x2,…, xn)是统计量T = g(X1,X2,…,Xn)的观察值. 二、样本矩 下面给出几个常用的统计量.设(X1,X2,…,Xn)是来自总体 X 的一个样本,(x1,x2,…,xn)是样本观察值,定义: 样本均值 .

样本分差 . 样本标准差(均方差) . 样本k阶(原点)矩 (k=1,2,… ) . 样本k阶中心矩 (k=1,2,… ) . 显然 , . 它们的观察值分别为 ,

, . 三、顺序统计量 定义2 (X1,X2,…,Xn)是总体X的一个样本,(x1,x2,…,xn)是一个样本观察值,将它由小到大的顺序排列,得到x(1)≤x(2)≤…≤x(n) ,取x(i)作为X(i)的观测值,由此得到的统计量X(1),X(2),…,X(n)称为样本(X1,X2,…,Xn)的一组顺序统计量,X(i)称为第i个顺序统计量或第i项.统计量 Rn = x(n)-x(1) 分别称为样本中位数和样本极差. 样本均值、顺序统计量的首项及末项、样本中位数描述了样本在数轴上的大致位置;样本方差与样本极差描述了样本的分散程度.

第三节 样本分布函数与频率直方图 一、样本分布函数 第三节 样本分布函数与频率直方图 一、样本分布函数 样本能够反映总体X的信息,总体X的分布函数F(x)是否能由样本来“表示”?回答是肯定的,我们用下面介绍的样本函数来近似表示总体X的分布函数. 定义 设x(1),x(2),…,x(n)是总体X的顺序统计量的一组观察值,对于任意的实数x,定义函数 称Fn(x)为总体X的样本分布函数(或经验分布函数).

样本分布函数Fn(x)不仅与样本容量 n 有关, 还与所得到的样本观察值有关,故它是随机变量.Fn(x)的图形(图6-1)呈跳跃上升的台阶状, 在x(1),x(2),…,x(n)中的不重复的值处,跳跃高度为 ;在重复 l 次的值处,跳跃高度为 .图6-1中的曲线是总体 X 的理论分布函数 F(x) 的图形. 图6-1

样本分布函数Fn(x)具有以下性质: 1°0≤Fn(x)≤1; 2°Fn(x)是单调不减函数; 3°Fn(x)是处处右连续的. 对于样本观察值 (x1,x2,…,xn),为了求其对应的样本分布函数 Fn(x) 之值,只须将这 n 个值中小于或等 x 的个数除以样本容量 n 即可.对于给定的x,Fn(x)是 n 次重复独立试验中事件 {X≤x} 出现的频率,而理论分布函数F(x)是事件{X≤x}发生的概率,由伯努利定理知,对任意给定的正数ε,有 , 即Fn(x)按概率收敛于F(x).进一步还有如下结论. 定理 (格利文科(W. Glivenko)定理) 设总体X的分布函数为F(x), 样本分布函数Fn(x),则对于任何实数x,有 . 证明从略. 以上结论是我们用样本去推断总体的依据.

a=t0<t1<t2<…<tk-1<tk=b. 二、频率直方图 如果说样本分布函数是通过随机样本对总体分布函数的反映,那么下面介绍的频率直方图就是样本对总体概率密度函数的反映(假设总体是连续随机变量). 依据总体 X 的一个样本观察值(x1,x2,…,xn)画直方图的一般步骤如下: 1°找出x1,x2,…,xn中的最小值x(1)与最大值x(n). 2°选择常数a、b(a≤x(1),b≥x(n)),在区间[a,b]内插入k-1个分点; a=t0<t1<t2<…<tk-1<tk=b. 用来对样本观察值进行分组.为了方便,可将区间[a,b]分成 k 等分,此时组距是 i=1,2,…,k. 组数 k 要选择适当.一般地说,当20≤n≤100时,取 k 为 5~10;当 n>100时,取 k 为10~15.通常取 ti 比样本观察值精度高一位.

fi≈P{ti-1<X≤ti}=pi,i=1,2,…,k, 3°对于每个小区间(ti-1,ti],数出x1,x2,…,xn落入其中的个数 ni (称为频数),再算出频率 ,i=1, 2, …, k. 4°在 xOy 平面上, 对每个 i, 画出以(ti-1,ti] 为底,以 yi=fi /Δt (i=1,2,…,k) 为高的矩形.这种图称为频率直方图,简称直方图. 直方图中第 i 个小矩形面积 yiΔt=fi (i=1,2,…,k),k 个小矩形的面积之和为1. 由于样本观察值的 n 个数值 x1,x2,…,xn是从总体X 中独立抽取的,它们落入区间 (ti-1,ti] 的频率 fi 近似等于随机变量 X 在该区间内取值的概率,即 fi≈P{ti-1<X≤ti}=pi,i=1,2,…,k, 当 X 是连续随机变量,且概率密度为 f (x) 时,则有 ,i=1,2,…,k. 由此可见直方图在一定程度上反映了X 的概率密度情况.

试根据这些数据作出直方图,并根据直方图估计含硅量 X 的分布. 0.86 0.83 0.77 0.81 0.80 0.79 0.82 0.87 0.78 0.71 0.95 0.76 0.84 0.90 0.75 0.73 0.89 0.74 0.85 0.88 0.65 0.64 试根据这些数据作出直方图,并根据直方图估计含硅量 X 的分布.

解 1°从n=120个数据中找出最小值 x(1)= 0.64及最大值 x(120)= 0.95. 2°取 a = 0.635, b = 0.955, 分 k = 16 组,组距 . 3°分组及频数如表 6-1所示.表中的组中值 (i=1,2,…,16)将会在第八章第五节用到. 4°以横轴 x 轴表示含硅量,a= t0= 0.635,t1= 0.655,…,t15= 0.935, b= t16 = 0.955,Δt = 0.02,取纵坐标的单位长为 ,则直方图中第 i 个矩形的高度 , 正好是 ni (i=1,2,…,16)个单位.

分组(ti-1,ti)] 频 数 组中值 0.635~0.655 2 0.645 0.655~0.675 0 0.665 0.675~0.695 0 0.685 0.695~0.715 2 0.705 0.715~0.735 2 0.725 0.735~0.755 8 0.745 0.755~0.775 13 0.765 0.775~0.795 23 0.785 0.795~0.815 24 0.805 0.815~0.835 21 0.825 0.835~0.855 14 0.845 0.855~0.875 6 0.865 0.875~0.895 2 0.885 0.895~0.915 2 0.905 0.915~0.935 0 0.925 0.935~0.955 1 0.945

有了直方图,就可以大致画出 X 的概率密度曲线.从图上看,曲线很象正态分布的概率密度曲线. 14 6 1 有了直方图,就可以大致画出 X 的概率密度曲线.从图上看,曲线很象正态分布的概率密度曲线.

第四节 几个常用统计量的分布 统计量是样本的函数,它是一个随机变量, 下面介绍来自正态总体的几个常用统计量的分布. 一、 分布 第四节 几个常用统计量的分布 统计量是样本的函数,它是一个随机变量, 下面介绍来自正态总体的几个常用统计量的分布. 一、 分布 1.定义 设X1,X2,…,Xn是来自正态总体N(0,1)的样本,则称统计量 为服从自由度为 n 的 分布,记作 ~ (n). f(x) n=1 n=5 n=15 x 2. (n)分布的概率密度(不证): 其中 为 函数 在 处的函数值.

3.(n)分布的性质: 性质1:设 ~ (n),则E( )=n,D( )=2n. 证:因Xi~N(0,1),E(Xi2)=1 ,D(Xi)=1. . 性质2:设 X~ (n1),Y~ (n2),且X与Y相互独立, 则 X+Y~ (n1+n2). 性质3:设 为X的样本,则 . 证: ,由定义 性质4:设 ~ (n),则对任意实数x,有

4. (n)分布的上 分位点: 设 ~ (n),对于给定的正数 , 称满足条件 的点 为 (n) 分布的上 分位点. 例如 取 ,则查附表4(395)有 . 4. (n)分布的上 分位点: 设 ~ (n),对于给定的正数 , 称满足条件 的点 为 (n) 分布的上 分位点. f(x) x

二、t 分布(学生分布) 1.定义 设X~N (0,1),Y~ (n),且 X 与Y 独立,则称随机变量 服从自由度为 n 的 t 分布,记作 t ~ t (n). 2.t (n)分布的概率密度(不证): 3.性质:t (n) 分布的概率密度关于 y 轴对称,且

设 t ~ t (n),对于给定正数 ,称满足条件 的点 为 t (n) 分布的上 分位点,且有 f(x) x n=10 n=4 n=1 4.t (n) 分布的上 分位点: 设 t ~ t (n),对于给定正数 ,称满足条件 的点 为 t (n) 分布的上 分位点,且有 .

三、F分布 1.定义:设X~ (m),Y~ (n),且 X 与 Y 独立,则称随机变量 为服从自由度是 m、n 的 F分布,记作 F~F (m, n), 其中 m 称为第一自由度,n 称为第二自由度. 2.F(m,n)分布的概率密度为

设 F~F(m, n),对于给定正数 ,称满足条件 的点 为F(m, n)分布的上 分位点,且有 x f(x) 4.F (m, n) 分布的上 分位点: 设 F~F(m, n),对于给定正数 ,称满足条件 的点 为F(m, n)分布的上 分位点,且有 .

第五节 正态总体统计量的分布 本节介绍来自正态总体的样本均值与样本方差的抽样分布.这是参数估计与假设检验的基础. 第五节 正态总体统计量的分布 本节介绍来自正态总体的样本均值与样本方差的抽样分布.这是参数估计与假设检验的基础. 定理1 设 为来自总体 X 的样本,则 , . 定理2 . 定理3 设X1,X2,…,Xn是正态总体 的一个样本,则样本均值 与样本方差 S 2 相互独立,且有 .

定理4 设X1,X2,…,Xn是正态总体 的样本, 与S 2分别为样本均值与样本方差, 则有 . 证 由 , 则有 . 定理5 设总体 ,总体 ,且 X 与 Y 独立.X1,X2,…,与Y1,Y2,…,分别为来自总体 X 与总体 Y 的样本,且这两组样本相互独立. ,则有

, . (ii) 若 ,则 , 其中 . (iii) .

(iv) . 证 (i) 略 (ii) 由定理 3 得 , , 于是 . 又由 (i) 及 t 分布定义,有 即 , .

(iv) 由定理 3, ,则 即 , .

例1 从总体 N ( 52,6.32 ) 中随机抽取一容量为 36 的样本,求样本均值 落在 50.8 到 53.8 之间的概率. 解 . 由 , 即 ,得所求概率为

例2 设 X1,X2,…,X10 为总体 N (0,0.09)的一个样本,求 . 解 由 , , 则有 .(查 表394页)

例3 设总体 , 样本 X1, X2, …,X6,设 Y = ( X1+X2+X3 )2 + ( X4+X5+X6 )2,求C, 使CY 服从 分布,并求自由度. 由独立性有 , 取 ,有 ,自由度为2. 解 由 , 有 , ,