二项分布.

Slides:



Advertisements
Similar presentations
因数与倍数 2 、 5 的倍数的特征
Advertisements

质数和合数 2 的因数( ) 6 的因数( ) 10 的因数 ( ) 12 的因数 ( ) 14 的因数 ( ) 11 的因数 ( ) 4 的因数( ) 9 的因数( ) 8 的因数( ) 7 的因数( ) 1 、 2 、 3 、 4 、 6 、 12 1 、 11 1 、 2 、 5 、 10.
小结与复习( 4 ). 1 、内容小结 互斥事件互斥事件 不对立不对立 特点特点 ⑴ A 、 B 不能同时发生, A 发生必 然 B 不发生。 ⑵事件 A+B 是随机事件 概率概率 ,又若 A 1 , A 2 , … , A n 彼此互斥,则 对立对立 特点特点 ⑴ A 、 B 不能同时发生,但必有一.
卡方检验. 内容 卡方检验入门 1 配对设计两样本率比较的 χ2 检验 2 行列表资料的分析 3 确切概率法 4.
第一章 、随机事件与概率 1.1 、随机事件 1.2 、随机事件的概率 1.3 、随机事件概率的计算 1.4 、伯努利概型.
第五节 函数的微分 一、微分的定义 二、微分的几何意义 三、基本初等函数的微分公式与微分运算 法则 四、微分形式不变性 五、微分在近似计算中的应用 六、小结.
2.8 函数的微分 1 微分的定义 2 微分的几何意义 3 微分公式与微分运算法则 4 微分在近似计算中的应用.
2.6 隐函数微分法 第二章 第二章 二、高阶导数 一、隐式定义的函数 三、可微函数的有理幂. 一、隐函数的导数 若由方程 可确定 y 是 x 的函数, 由 表示的函数, 称为显函数. 例如, 可确定显函数 可确定 y 是 x 的函数, 但此隐函数不能显化. 函数为隐函数. 则称此 隐函数求导方法.
2.5 函数的微分 一、问题的提出 二、微分的定义 三、可微的条件 四、微分的几何意义 五、微分的求法 六、小结.
7.1 假设检验 1. 假设检验的基本原理 2. 假设检验的相关概念 3. 假设检验的一般步骤 4. 典型例题 5. 小结.
第十七章 分类资料的统计推断.
圆的一般方程 (x-a)2 +(y-b)2=r2 x2+y2+Dx+Ey+F=0 Ax2+Bxy+Cy2+Dx+Ey+ F=0.
导游资格证考试概要.
3.1.3 概率的基本性质.
第四章 概率、正态分布、常用统计分布.
6.6 单侧置信限 1、问题的引入 2、基本概念 3、典型例题 4、小结.
易學基礎教程 國文系99 王隆運. 易學基礎教程 國文系99 王隆運.
完全随机设计多样本资料秩和检验.
第 8 章 假设检验 作者:中国人民大学统计学院 贾俊平 PowerPoint 统计学.
计数资料的统计推断 (2 学时) 吴成秋 公共卫生学院预防医学系
Distribution and Application of Discrete Variable
第5章 定积分及其应用 基本要求 5.1 定积分的概念与性质 5.2 微积分基本公式 5.3 定积分的换元积分法与分部积分法
第三篇 医学统计学方法. 第三篇 医学统计学方法 医学统计学方法 实习2 主讲人 陶育纯 医学统计学方法 实习2 主讲人 陶育纯 流行病与卫生统计学教研室
本讲义可在网址 或 ftp://math.shekou.com 下载
第三节 格林公式及其应用(2) 一、曲线积分与路径无关的定义 二、曲线积分与路径无关的条件 三、二元函数的全微分的求积 四、小结.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第三章 导数与微分 习 题 课 主要内容 典型例题.
2-7、函数的微分 教学要求 教学要点.
§5 微分及其应用 一、微分的概念 实例:正方形金属薄片受热后面积的改变量..
第四章 抽样误差与假设检验 要求: 掌握:均数的抽样误差与标准误,t分 布的特征,t界值表,总体均数可信区间及其与参考值范围的区别。
区间估计 Interval Estimation.
探索三角形相似的条件(2).
初中数学八年级下册 (苏科版) 10.4 探索三角形 相似的条件(2).
统计学期末复习
第6章 统计量及其抽样分布 统计量 关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布
第三章 多维随机变量及其分布 §2 边缘分布 边缘分布函数 边缘分布律 边缘概率密度.
例1 :甲击中的环数; X :乙击中的环数; Y 平较高? 试问哪一个人的射击水 : 的射击水平由下表给出 甲、乙两人射击,他们
计算机数学基础 主讲老师: 邓辉文.
第十章 方差分析.
给孩子做一面明亮的镜子 给孩子做一面明亮的镜子.
常用概率分布 ---Poisson分布.
连续型随机变量及其概率密度 一、概率密度的概念与性质 二、常见连续型随机变量的分布 三、小结.
第七章 参数估计 7.3 参数的区间估计.
习题 一、概率论 1.已知随机事件A,B,C满足 在下列三种情况下,计算 (1)A,B,C相互独立 (2)A,B独立,A,C互不相容
抽样和抽样分布 基本计算 Sampling & Sampling distribution
两组两分类资料检验.
概 率 统 计 主讲教师 叶宏 山东大学数学院.
线 性 代 数 厦门大学线性代数教学组 2019年4月24日6时8分 / 45.
5.2 常用统计分布 一、常见分布 二、概率分布的分位数 三、小结.
完全随机设计多组资料的比较 赵耐青 卫生统计教研室.
用计算器开方.
§6.7 子空间的直和 一、直和的定义 二、直和的判定 三、多个子空间的直和.
相关与回归 非确定关系 在宏观上存在关系,但并未精确到可以用函数关系来表达。青少年身高与年龄,体重与体表面积 非确定关系:
1.设A和B是集合,证明:A=B当且仅当A∩B=A∪B
概 率 统 计 主讲教师 叶宏 山东大学数学院.
第四节 随机变量函数的概率分布 X 是分布已知的随机变量,g ( · ) 是一个已知 的连续函数,如何求随机变量 Y =g(X ) 的分布?
第一部分:概率 产生随机样本:对分布采样 均匀分布 其他分布 伪随机数 很多统计软件包中都有此工具 如在Matlab中:rand
第15讲 特征值与特征向量的性质 主要内容:特征值与特征向量的性质.
§5.2 抽样分布   确定统计量的分布——抽样分布,是数理统计的基本问题之一.采用求随机向量的函数的分布的方法可得到抽样分布.由于样本容量一般不止2或 3(甚至还可能是随机的),故计算往往很复杂,有时还需要特殊技巧或特殊工具.   由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.
第二节 函数的极限 一、函数极限的定义 二、函数极限的性质 三、小结 思考题.
第三节 随机区组设计的方差分析 随机区组设计资料的总平方和可以分解为三项: (10.10).
难点:连续变量函数分布与二维连续变量分布
第十五讲 区间估计 本次课讲完区间估计并开始讲授假设检验部分 下次课结束假设检验,并进行全书复习 本次课程后完成作业的后两部分
单样本检验.
第三章 从概率分布函数的抽样 (Sampling from Probability Distribution Functions)
贝叶斯估计 Bayes Estimation
第五章 二项分布和Poisson 分布及其应用
第3讲 概率论初步 3.1 概率 条件概率和加法公式 3.3 计数原则.
假设检验.
Presentation transcript:

二项分布

内容 二项分布概念 1 二项分布应用 2 STATA命令 3

引 子 玛丽琳·沃斯萨范特是作为“高智商”者被载入吉尼斯大全的一位女士,她为周日报纸主持“请问玛丽琳”这样一个专栏,该专栏致力于智力、技巧方面的游戏。有一次的题目是这样的: 从三扇门里面选择一扇门,其中一扇门后面是汽车,另两个后面是山羊。现在你已经选好了一扇门,主持人打开另两扇中的一个,看到是一只山羊,然后主持人问:想改变选择吗?请问:改变选择是否对你有利(更可能赢得汽车)?

引 子 玛丽琳的回答 是的,你应当改变选择,因为当初选择时只有1/3的机会赢得汽车,而改变的话(由于已经去掉了一扇门),会有2/3的机会获胜。 她的回答对吗?

引 子 热情的读者来信 你就是那只山羊!--西部州立大学 引 子 热情的读者来信 你就是那只山羊!--西部州立大学 你错了,但要看到积极的一面,要是所有理学博士都错了,这个国家将陷于严重的麻烦之中。--美国军事研究院 我希望对这个问题的争论会唤起公众对我国数学教育严重危机的注意,如果你能承认错误,你将为扭转这种尴尬局面做出积极的贡献。你是否知道有多少被激怒的数学家在等着你改变想法?--乔治敦大学

二项分布基本概念 注意:两分类变量并非一定会服从二项分布 Bernoulli试验 例:袋子里有5只乒乓球,2黄3白。每次摸1球,放回后再摸。摸100次,摸到黄球的次数为… 对每一次实验,出现的结果只有两种情况,称为Bernoulli试验。如所关心的事件A发生,称为“成功”,否则称为失败每次试验结果,只能是两个互斥的结果之一

二项分布基本概念 Bernoulli试验序列 在重复实验中,如果对每一次实验,出现的结果只有两种情况,即Bernoulli试验。 每次试验的条件不变。即每次试验中,结果A发生的概率不变(假设均为 )。 各次试验独立。即一次试验出现什么样的结果与前面已出现的结果无关。 由满足以上三个条件的n次Bernoulli试验构成的序列被称为是Bernoulli试验序列 (n是固定的)。

二项分布基本概念 二项分布 对于Bernoulli试验序列的n次试验,结局A出现的次数X的概率分布服从二项分布 二项分布指的是概率的分布 注意:二项分布是一个离散型分布

二项分布的两个参数 显然对于不同的n、不同的有不同的二项分布。它们是二项分布的两个参数。 若X服从二项分布,则记X~B(n, )。

二项分布的基本特征 二项分布的名称由来是因为计算公式中含有二项式的展开项 二项分布的均数和方差 μ=n  方差=n(1- )

二项分布的基本特征 当 =0.5时,图形对称;当 ≠0.5时,图形呈偏态,但随n的增大,图形逐渐对称。

样本率的抽样分布 对于大量重复随机抽样而言,样本率p围绕着总体率附近随机波动,样本量n的值越大,这种波动的幅度就越小。 当n充分大时,p的分布就近似于均数为,标准差为sqrt( (1- )/n)的正态分布。 一般的标准是n和n(1- )均大于5,且n>40 当样本情况接近此标准时,往往会进行校正 注意:上文所说的样本率p的标准差,为了区分阳性数x的标准差,亦称样本率的标准差为标准误。

二项分布的应用

总体率的区间估计 对一个总体参数都有点估计和区间估计,点估计直接使用样本统计量即可 区间估计:直接计算概率 在样本例数较小,且样本率接近1或0,即阳性事件发生率很高或很低时,可按照率的抽样分布规律确定总体率的可信区间,为方便应用,统计学家根据二项分布原理,编制了总体率95%和99%可信区间的百分率可信区间表

总体率的区间估计 区间估计:正态近似 当n较大, 和1- 均不太小时,样本率的抽样分布近似正态分布,因此可按正态近似法求总体率的1- 可信区间。 Stata计算 没有这么麻烦,使用cii命令即自动完成 例6.1 某疗法治疗某病28人,6人有效,求该疗法有效率的95%可信区间。 例6.2 某疗法治疗某病10人,7人有效,求该疗法有效率的95%可信区间。

样本率与已知总体率的比较 如前所述,当n较大, 和1- 均不太小时,样本率的抽样分布近似正态分布,可利用正态分布的原理作假设检验。 反之,则可使用二项分布自身的概率分布进行假设检验,这种方法被称为确切概率法

样本率与已知总体率的比较 例6.4 用常规疗法治疗流行性出血热的病死率为15%,现用某新法治疗50名患者,死亡6例,问新法治疗流行性出血热的病死率是否不等于常规疗法。 由于样本量较大,因此可以考虑采用正态近似法分析

样本率与已知总体率的比较 假设检验(正态近似法) H0:新法和常规疗法治疗流行性出血热的病死率相等,  = 0 设=0.05 检验统计量为 当H0成立时,统计量U近似服从标准正态分布。 即:若|U|>1.96 ,则拒绝H0。

样本率与已知总体率的比较 本例: |U|<1.96,不能拒绝H0,因此没有足够的增加证据可以推断新疗法的病死率与传统认疗法不同。 Stata 操作命令为:prtesti 50 6 0.15,count 结果与上述相同。

样本率与已知总体率的比较 样本量较小,需要使用确切概率计算来完成分析 显然,本次检验应当是双侧检验。 例6.5 已知A药物治疗幽门螺旋杆菌感染的治愈率为60%。现拟用B药物治疗。现用B药治疗幽门螺旋杆菌感染患者10人,其中9人治愈。问B药治疗幽门螺旋杆菌感染的治愈率是否不同于A药的治愈率。 样本量较小,需要使用确切概率计算来完成分析 显然,本次检验应当是双侧检验。

确切概率法的基本思想 假设检验可以理解为根据水平,把统计量可能的取值范围分为拒绝范围(亦称拒绝域)和不拒绝范围。如果统计量的取值落在拒绝范围内(即:P< ),则拒绝H0,反之不拒绝H0。 对于确切概率法也是相同的,根据水平,把可能的样本点范围分为拒绝范围和不拒绝范围,如果样本点X落在拒绝范围内,则拒绝H0,反之不拒绝H0。

确切概率法的基本思想 拒绝范围构成的(双侧检验)基本原则(以下是H0为真的假设下的概率): 属于拒绝范围内的任一可能样本点的概率小于非拒绝范围的任一可能样本点的概率; 拒绝范围内所有可能样本点的累积概率< ,并且对于非拒绝范围内的任一可能样本点加入拒绝范围,都将使其累积概率> 。 定义:记P=小于等于实际样本点概率的所有可能样本点概率之和。

确切概率法的基本思想 如果实际样本点在拒绝范围内,根据P值定义和拒绝范围构成的原则可知,P< ,可以拒绝H0。

样本率与已知总体率的比较 建立假设 H0:B药的幽门螺旋杆菌感染治愈率=60% H1:B药的幽门螺旋杆菌感染治愈率 60% 双侧检验=0.05 计算概率值 P=小于等于实际样本点概率的所有可能样本点概率之和 先计算样本点的概率

样本率与已知总体率的比较 假设H0为真的情况下,计算治愈人数的概率分布 也可以用Stata命令bitesti 10 9 0.6得到相同的结果。

样本率与已知总体率的比较 如果研究前已知道B药疗效不低于A药的信息,则此例研究问题可改为单侧检验 H0:=0.6 vs H1:>0.6 =0.05 可首先计算成立时总体中出现现有样本点X=9的概率 计算H1:方向更极端的情况。 P=P9+P10=0.0403108+0.0060466=0.0463574< 拒绝H0。

成组设计两样本率的比较 一般而言,在这种情况下用得比较多的都是大样本情况下的正态近似检验,本书中的例题也均为这种情况 显然,当样本量小的时候,可以使用确切概率法加以检验,但这一部分的内容将在随后的课程中讲述

成组设计两样本率的比较 例6.6 为了解含氟牙膏预防龋齿的效果,共调查使用含氟牙膏的儿童200名,患龋齿人数为70人,使用一般牙膏的儿童100人,患龋齿人数为45人,问使用含氟牙膏与使用一般牙膏儿童的龋患率有无差别。 本例符合正态近似的条件,使用含氟牙膏和一般牙膏儿童的样本龋患率近似正态分布,采用u检验进行统计推断。

成组设计两样本率的比较 建立假设 H0:用含氟牙膏和一般牙膏儿童龋患率相等 H1:用含氟牙膏和一般牙膏儿童龋患率不等 随后的分析过程和两样本的u检验无太大差异,不再详述 还有另一个等价的、更通用的方法可供使用:卡方检验

Stata计算 总体率的区间计算 cii 样本量 时间发生数 样本率与总体率的比较 prtesti 样本量 事件发生数 总体率,count

Thank You !