Download presentation
Presentation is loading. Please wait.
1
概率与概率分布 主讲人:孟迎芳
2
总体 参数 样本 统计量 推论性统计 描述性统计 推论 随机选择 populations parameters samples
statistics 描述性统计
3
推论性统计 一、如何使所抽取的样本对总体有最好的代表性? 采用一种合适的抽样方法来解决; 二、样本的结果能在多大程度上代表总体的情况?
采用一种合适的抽样方法来解决; 二、样本的结果能在多大程度上代表总体的情况? 抽样分布 样本 总体 概率分布
4
本章重点 概率的基本知识 正态分布与二项分布的应用 t分布、分布、F分布的特征
5
第一节 概率及概率分布概述 概率的定义 表示随机事件出现可能性大小的客观指标 随机现象 的各种可能结果 频率 规律性 先验概率或古典概率
第一节 概率及概率分布概述 概率的定义 表示随机事件出现可能性大小的客观指标 随机现象 的各种可能结果 先验概率或古典概率 频率 规律性 后验概率或统计概率
6
不同次数的试验中正面向上的频率 试验批号 n=5 n=50 n=500 m f(A) 1 2 0.4 22 0.44 251 0.502 3
0.6 25 0.5 249 0.498 0.2 21 0.42 256 0.512 4 5 253 0.506 24 0.48 6 246 0.492 7 0.8 18 0.36 244 0.488 8 258 0.516 9 27 0.54 262 0.524 10 31 0.62 247 0.494
7
第一节 概率及概率分布概述 概率的基本性质 概率的公理系统 概率的加法定理 概率的乘法定理 互不相容事件 独立事件
8
一枚硬币掷三次,或三枚硬币各掷一次,问出现两次或两次以上正面的概率是多少?
HHH、HHT、HTH、THH TTH、THT、HTT、TTT
9
第一节 概率及概率分布概述 概率分布类型 所描述的数据特征 基本随机变量分布 抽样分布 变量是否具有连续性 离散分布 连续分布
依分布函数的来源 经验分布 理论分布 所描述的数据特征 基本随机变量分布 抽样分布 变量是否具有连续性 离散分布 连续分布 二项分布 正态分布 理论平均数、方差 二项分布 正态分布 样本统计量的分布 平均数、标准差
10
第二节 正态分布 正态分布特征 形式对称,对称轴经过平均数点。 中央点最高,然后逐渐向两 侧下降,但与基线永不相交。 曲线下方面积为1。
第二节 正态分布 正态分布特征 形式对称,对称轴经过平均数点。 中央点最高,然后逐渐向两 侧下降,但与基线永不相交。 曲线下方面积为1。 曲线形态由均数和标准差决定。 标准差与概率(面积)有一定的数量关系。
12
第二节 正态分布 正态分布的检验 =0 正态分布 >0 正偏态 <0 负偏态 =0 正态分布的峰度 >0 峰度低阔
第二节 正态分布 正态分布的检验 =0 正态分布 >0 正偏态 <0 负偏态 =0 正态分布的峰度 >0 峰度低阔 <0 峰度高狭 偏度 峰度 Analyze--descriptives(Frequencies)--skewness(偏度)、kurtosis(峰度)
13
第二节 正态分布 标准正态分布
14
第二节 正态分布 标准正态分布表 p y Z 根据Z分数查概率 根据概率查Z分数
15
求某Z分数值与平均数之间的概率 求某Z分数以上或以下的概率 求两个Z分数之间的概率
16
已知从平均数开始的概率值求Z值 已知位于正态分布两端的概率值求该概率值分界点的Z值 已知正态曲线下中央部分的概率值,求Z分数
17
练习题 设X~N(μ,σ2 ),求以下概率: (1)P{μ-σ<X<= μ+σ}
68.26% 99.74% 84.13%
18
练习题 某年高考平均分500,标准差100,考分呈正态分布,某考生得到650分。设当年高考录取率为10%,问该生能否被录取?
答案:Z = 1.5, P = .933 录取分数线: *100=628
19
练习题 已知X~N(72,122),问25%和75%两个百分位数之差?百里挑一,X至少是多少? 答案:80.04-63.96=16.08
2.33, 99.96
20
练习题 某地区47000人参加高考,物理学平均分为57.08,标准差为18.04。问: (1)成绩在90以上有多少人?
(2)成绩在80-90之间有多少人? (3)60分以下有多少人? , 人 ,3180人 ,26487人
21
第二节 正态分布 正态分布理论在测验中的应用 化等级评定为等距分数 确定测验题目的难易度 测验分数的正态化 在能力分组或等级评定时确定人数
第二节 正态分布 正态分布理论在测验中的应用 化等级评定为等距分数 确定测验题目的难易度 测验分数的正态化 在能力分组或等级评定时确定人数 Analyze--descriptives-- save standardized values as variables
22
化等级评定为测量数据 对100个样品的评定结果 对三个样品的评定结果 专家 甲 乙 丙 评定等级 A 5 10 20 B 25 2 C 40
教师甲 P 等级中点 中点以下累加 z A 0.05 0.025 0.975 1.96 B 0.25 0.125 0.825 0.94 C 0.40 0.2 0.5 D 0.175 -0.94 E -1.96 化等级评定为测量数据 对100个样品的评定结果 对三个样品的评定结果 专家 甲 乙 丙 评定等级 A 5 10 20 B 25 2 C 40 35 D 15 E 总数 100 专家 甲 乙 丙 样品 一 B A 二 三 D C
23
有一份心理测验共10道题,需要确定各题目的难度,以便确定各题的得分。我们随机选取了若干名学生按正式测验的要求进行试测,得到相应的测验结果见下表。
题目编号 通过率(%) P z z+5 1 99 0.49 -2.331 2.669 2 95 0.45 -1.645 3.355 3 85 0.35 -1.035 3.965 4 80 0.30 -0.84 4.16 5 75 0.25 -0.675 4.325 6 70 0.20 -0.525 4.475 7 50 8 20 0.84 5.84 9 1.645 6.645 10 2.33 7.33
24
某研究中随机抽取了180名学生的某一能力测验分数,结果见下表,由于这些能力分数不是正态,需要将其正态化。
原始分数 次数 累加次数 累加频率 P z T 96 1 180 1.000 0.500 3.99 89.9 95 7 179 0.994 0.494 2.51 75.1 94 5 172 0.956 0.456 1.705 67.05 92 10 162 0.900 0.400 1.28 62.8 … 47 12 0.067 0.433 -1.50 35 45 0.028 0.472 -1.91 30.9 ∑
25
对100件新设计的服装样品进行评定,评定结果分为A,B,C,D,E五等级,各等级应该有多少件,才能使等级评定做到等距?
各等级界限(z) P 人数 A 1.8σ以上 0.0359 4 B 0.6σ~1.8σ 0.2384 24 C -0.6σ~0.6σ 0.4514 44 D -1.8σ~ -0.6σ E -1.8σ以下
26
确定等级评定的人数
27
第三节 二项分布 binominal distribution 一个学生全凭猜测答2道是非题,则答对0、1、2题的概率是多大?
第三节 二项分布 binominal distribution 一个学生全凭猜测答2道是非题,则答对0、1、2题的概率是多大? 如果是3道题、4道题呢?
28
2道是非题的情况 TT TF, FT FF 答对2题 答对1题 答对0题 1种 2种
29
3道是非题的情况 TTT TTF, TFT, FTT TFF, FTF, FFT FFF 答对3题 答对2题 答对1题 答对0题 1种 3种
30
TTFF, TFFT, FFTT,TFTF, FTTF, FTFT
4道是非题的情况 TTTT TTTF, TTFT, TFTT,FTTT TTFF, TFFT, FFTT,TFTF, FTTF, FTFT TFFF, FTFF, FFTF, FFFT FFFF 答对4题 答对3题 答对2题 答对1题 答对0题 1种 4种 6种
31
第三节 二项分布 二项试验与二项分布 满足以下条件的试验称为二项试验: 一次试验只有两种可能结果,即成功和失败; 各次试验相互独立,互不影响
第三节 二项分布 二项试验与二项分布 满足以下条件的试验称为二项试验: 一次试验只有两种可能结果,即成功和失败; 各次试验相互独立,互不影响 各次试验中成功的概率相等。
32
二项分布函数 用n次方的二项展开式来表达在n次二项试验中成功事件出现不同次数(X=0,1,…,n)的概率分布叫做二项分布。
33
二项分布图 从二项分布图可以看出,当p=q,不管n多大,二项分布呈对称形。
当n很大时,二项分布接近于正态分布。当n趋近于无限大时,正态分布是二项分布的极限。
34
当p≠.5时 设某厂产品合格率为90%,抽取3个进行检验,求合格品个数分别为0,1,2,3的概率?
35
当p=.9 q=.1时 检验结果 概率 结果 AAA AAB ABA BAA ABB BAB BBA BBB ppp ppq pqq qqq
.729 .081 .009 .001 合计 1.00
36
第三节 二项分布 二项分布的性质 离散型分布
37
第三节 二项分布 二项分布的应用 区分猜测而造成的结果与真实的结果之间的界限。
第三节 二项分布 二项分布的应用 区分猜测而造成的结果与真实的结果之间的界限。 例:有10道是非题,问答对几题才可以说学生真正掌握了考试内容,而不是凭猜测回答的。
38
例:有10道是非题,问答对几题才可以说学生真正掌握了考试内容,而不是凭猜测回答的。
猜对的题数(X) X! 1 362880 10 2 80640 45 3 6 30240 120 4 24 17280 210 5 14400 252 720 7 5040 8 40320 9
39
例:有100道是非题,问答对几题才可以说学生真正掌握了考试内容,而不是凭猜测回答的。
解:因为 p=q=0.5,N=100,Np=50≥5 根据正态分布概率,当Z=1.645时,该点以下包含了全体的95%。如果用原始分数表示,则为=50+1.645×5=58.225≈58题,它的意义是,完全凭猜测,100题中猜对58题以上的可能性只有5%。因此可以推论说,答对58题以上者不是凭猜测,表明答题者真的会答,但做此结论,也仍有犯错误的可能,即那些完全靠猜测的人也有5%的可能性答对58题以上。
40
复习 概率的定义、概率的公理系统、概率的加法及乘法法则 概率分布的定义和分类 正态分布的定义及特征、标准正态分布 正态分布表的使用
举例说明正态分布理论在实际生活中的应用 二项分布的定义及应用
41
下节课内容 抽样理论与参数估计
Similar presentations