第四章 概率、正态分布、常用统计分布.

Slides:



Advertisements
Similar presentations
第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
Advertisements

第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
概率统计与随机过程 宋 晖 – 2013年秋.
§5.2 中心极限定理 定理3(同分布中心极限定理)设随机变量X1, X2, …, Xn, …相互独立,服从相同分布,且有有限的数学期望和方差,即: E(Xk) =,D(Xk) =2,k = 1, 2, … 则随机变量 的分布函数Fn(x)满足: 对任意的x,有.
第一节 数理统计的基本概念.
统 计 学 (第三版) 2008 作者 贾俊平 统计学.
Exam 2考试知识点思维导图.
第三章 概率及概率分布 教学目的: (1)理解试验、事件、样本空间、概率定义 (2)学习描述和使用概率的运算法则
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
第五章 抽样调查 第一节 抽样调查概述 第二节 抽样调查的数理基础 第三节 抽样误差与参数估计 第四节 抽样调查的组织方式
08-09冬季学期 概率论与数理统计 姜旭峰,胡玉磊.
高二数学 选修 正态分布.
第五节 微积分基本公式 、变速直线运动中位置函数与速度 函数的联系 二、积分上限函数及其导数 三、牛顿—莱布尼茨公式.
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
主要内容 § 3.1 多维随机变量及联合分布 联合分布函里数 联合分布律 联合概率密度 § 3.2 二维随机变量的边缘分布
本讲义可在网址 或 ftp://math.shekou.com 下载
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
区间估计 Interval Estimation.
统计学期末复习
Business Statistics Topic 6
第6章 统计量及其抽样分布 统计量 关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
第五章:随机变量的收敛性 随机样本:IID样本 , 统计量:对随机样本的概括 收敛性:当样本数量n趋向无穷大时,统计量的变化
本次课讲授:第二章第十一节,第十二节,第三章第一节, 下次课讲第三章第二节,第三节,第四节; 下次上课时交作业P29—P30
计算机数学基础 主讲老师: 邓辉文.
第十章 方差分析.
第六章 数理统计的基本知识 第一节 总体与样本
数据统计与分析 秦 猛 南京大学物理系 手机: 第十讲 数据统计与分析 秦 猛 南京大学物理系 办公室:唐仲英楼A 手机:
概 率 统 计 主讲教师 叶宏 山东大学数学院.
常用概率分布 ---Poisson分布.
连续型随机变量及其概率密度 一、概率密度的概念与性质 二、常见连续型随机变量的分布 三、小结.
第七章 参数估计 7.3 参数的区间估计.
第八章 常用统计分布.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
概率论 ( Probability) 2016年 2019年4月13日星期六.
抽样和抽样分布 基本计算 Sampling & Sampling distribution
概 率 统 计 主讲教师 叶宏 山东大学数学院.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
第5章 大数定律和中心极限定理 5.1 大数定律 5.2 中心极限定理.
用计算器开方.
第二章 随机变量及其分布 第一节 随机变量 第二节 离散随机变量及分布律 第三节 随机变量的分布函数 第四节 连续随机变量及概率密度
成绩是怎么算出来的? 16级第一学期半期考试成绩 班级 姓名 语文 数学 英语 政治 历史 地理 物理 化学 生物 总分 1 张三1 115
第一部分:概率 对应教材Chp1-5 课堂上讲述会较快,将知识点串起来,建议大家通读教材 主要内容: 随机变量及其分布
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
§5.2 中心极限定理 人们已经知道,在自然界和生产实践中遇到的大量随机 变量都服从或近似服从正态分布,正因如此,正态分布占有
正切函数的图象和性质 周期函数定义: 一般地,对于函数 (x),如果存在一个非零常数T,使得当x取定义域内的每一个值时,都有
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
一 测定气体分子速率分布的实验 实验装置 金属蒸汽 显示屏 狭缝 接抽气泵.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第4课时 绝对值.
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第 四 章 大 数 定 理 与 中 心 极 限 定 理.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
数理统计基本知识.
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
第三节 函数的微分 3.1 微分的概念 3.2 微分的计算 3.3 微分的应用.
第五章 数理统计的基本知识 §5.1 总体与样本.
单样本检验.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
§4.1数学期望.
第6章 数理统计基础 §6.1 数理统计的几个基本概念 §6.2 描述统计 §6.3 抽样分布.
Presentation transcript:

第四章 概率、正态分布、常用统计分布

第一节 概率及概率分布

1. 什么是随机现象?P64 具有非确定性、随机性的现象 2. 什么是概率?P65 随机现象发生可能性大小的数量表示 3. 概率的计算方法:频率法 P66 随机现象E出现的次数/N

概率分布要回答的是,随机现象一共有多少种结果,以及每种结果所伴随的概率是多少? 4. 什么是概率分布?P90 概率分布要回答的是,随机现象一共有多少种结果,以及每种结果所伴随的概率是多少? 例如,家庭结构(核心家庭、主干家庭、联合家庭、其他家庭(单亲家庭、残缺家庭等) )的概率分布。 5. 什么是概率分布图?P92 把概率分布画成折线图 6. 什么是概率密度、概率密度分布图?P95 当△x趋近于0时,随x变化的概率分布图(曲线图) 举例:北京大学居民的家庭规模?1、2、3、4、5、6、7、8 北京大学居民的收入?

多种概率密度分布图。 P41 偏态分布。P106 其中有一种叫正态分布, 对统计推论特别重要。

第二节 正态分布

正态分布的重要性 描述连续型随机变量的最重要的分布 社会科学领域很多变量是正态分布,或者可 以转化为正态分布 统计推断的基础 x j (x)

正态分布的概率密度函数 ¥ < - = x j , e 2 1 p ( ) j(x) = 随机变量 X 的频数  = 总体方差 m s p j(x) = 随机变量 X 的频数  = 总体方差  =3.14159; e = 2.71828 x = 随机变量的取值 (- < x < )  = 总体均值

正态分布的概率 概率是曲线下的面积! j(x) x a b 左右各一个标准差范围内的面积:68.27%; 左右各一个标准差范围内的面积:95.45%; P148 左右各一个标准差范围内的面积:99.73%;

正态分布函数的性质 概率密度函数在x 的上方,即j(x)>0 正态曲线的最高点在均值,它也是分布的中位数和众数 正态分布是一个分布族,每一特定正态分布通过均值的 标准差来区分。 正态分布曲线的位置,由决定: 当 不变,增大,图形右移; 正态分布曲线的“高矮胖瘦”由决定:当不变,越小,图形越尖 瘦。 曲线j(x)相对于均值对称,尾端向两个方向无限延伸, 且理论上永远不会与横轴相交 正态曲线下的总面积等于1

正态分布函数的特征 一个高峰 一个对称轴 一个渐进线 P144

使正态分布的峰度不同、位置不同(因为调查单位不同)。P151 因此,为了可以比较分析,必须对正态分布标准化。 和 对正态曲线的影响 使正态分布的峰度不同、位置不同(因为调查单位不同)。P151 因此,为了可以比较分析,必须对正态分布标准化。 x j(x) C A B

标准正态分布

标准正态分布的重要性 一般的正态分布取决于均值和标准差  计算概率时 ,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的 若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表(P485)

标准正态分布函数 任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布 标准正态分布的概率密度函数 ¥ < - = x , e 2 1 ) ( p j

标准正态分布 x m s 一般正态分布 标准正态分布  =1 Z   

标准正态分布表的使用 计算概率时 ,先计算变量取值的标准分, 再查标准正态概率分布表P485 对于标准正态分布,即X~N(0,1),有  (-z) z P (a z b)  b  a P (| z | a) 2 a 1

标准化的例子 怎么样查标准正态概率分布表? P157-160

第三节 其它几种常用的统计分布

样本方差的2分布

样本方差的2分布 设总体服从正态分布N ~ (μ,σ2 ), X1,X2,…,Xn为来自该正态总体的样本,则样本方差 s2 的分布为 将2(n – 1)称为自由度为(n-1)的卡方分布 P160

卡方 (c2) 分布 s m c2 总体 选择容量为n 的 简单随机样本 不同容量样本的抽样分布 计算样本方差S2 计算卡方值 计算出所有的  2值 65

小样本的t分布

t分布(小样本) t 设X1,X2,…,Xn1是来自正态总体N~(μ1,σ12 )的一个样本, 称 为统计量,它服从自由度为(n-1)的t 分布 P163 t 标准正态分布与 不同自由度的t分布 标准正态分布 t (df = 13) t (df = 5) Z 当自由度无限大时,t分布趋近于标准正态分布

方差分析的F分布

方差分析的F分布 a F(k-1,n-k) F 分布 P164 拒绝H0 不能拒绝H0 F 拒绝H0 不能拒绝H0 F 检验两组数据之间有没有差异?如两个班级学习成绩的有没有差异?

定类变量的二项分布与泊松分布

定类变量的二项分布与泊松分布 定类变量的二项分布;P122 当n 很小时,定类变量将是超几何分布; 当n很大,p又极小时,二项分布的极限分布是泊松分布;P137,比如交通事故率、公共电话的呼叫率等; 当np≥5时,二项分布近似于正态分布。

第四节 大数定理与中心极限定理

大数定理 少量的随机现象是没有稳定性规律的; 大量随机现象构成的总体,呈现的规律具有稳定性,有关这一系列的定理,称大数定理; 大数定理有:贝努里大数定理、切贝谢夫大数定理;P168 大数定理说明了大量现象的稳定规律:频率值趋于概率值,平均值趋于期望值。 例如,一家一户,在自然的生育的情况下,生男生女纯属偶然,但统计成千上万户的结果后,其性别比约为1/2将是稳定的。 所以,大数定理是把偶然性因素消除掉,使共性表现出来 大数定理抽样调查的大样本(n≧50)提供了理论基础

中心极限定理 中心极限定理研究在什么条件下,随机变量之和的分布可以近似为正态分布。 中心极限定理表明,如果一个现实的量是由大量独立偶然因素的影响叠加而得,且其中每一个偶然因素的影响又是均匀地微小的话,则可以断定这个量将近似服从正态分布。 这就解释了为什么在社会科学领域大量存在着服从正态分布的随机变量,例如身高、体重、智商、婚龄等,因为影响它们的因素都是大量的。 中心极限定理告诉我们:在抽样调查中,只要样本容量足够大,样本均值的分布都将是已知的,都接近正态分布。

样本均值的抽样分布 与中心极限定理 当总体服从正态分布N ~ (μ,σ2 )时,来自该总体的所有容量为n的样本的均值X也服从正态分布,X 的数学期望为μ,方差为σ2/n。即X~N(μ,σ2/n)  = 50  =10 X 总体分布 n = 4 抽样分布 X n =16

中心极限定理(图示) 中心极限定理:设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布 当样本容量足够大时(n  30) ,样本均值的抽样分布逐渐趋于正态分布 一个任意分布的总体 X