假设检验
康奈尔大学某教授得到了12张夜间非法泊车的罚款单, 这12张罚款单都是星期二和星期四得到的,请问:他是否只需要在星期二和星期四租用一个车库就没事了? 若这12张罚款单没有一张是星期天得到的,能否保证他星期天不会收到罚款单? 假定罚款单时间具有随机性,则12张罚款单全部都在星期二和星期四的概率为 2 7 12 =0.0000003. 只有 𝐶 7 2 =21日对,所以即使对任意两天来说,这个概率仍然很小,因此,有理由认为警方是有其体系的。 假定有随机性,此事件发生的概率是 6 7 12 ,近似于1/6,不可能有可靠的结论。
提纲 基本概念 正态总体均值的假设检验 正态总体方差的假设检验
何为假设检验 假设是指施加于一个或多个总体的概率分布或参数的假设. 所作假设可以被接受或被拒绝. 不合理: 反证法思想: 为判断所作的假设能否被接受, 先假设其成立, 然后从总体中抽取样本, 根据样本的取值看是否有不合理的现象出现, 最后作出接受或拒绝所作假设的决定. 不合理: 小概率事件在一次试验中几乎不会发生
主要内容 总体均值,总体方差的检验 双正态总体均值差,方差比的检验 参数检验 非参数检验 拟合优度检验 独立性检验
例 某产品出厂检验规定: 次品率p不超过4%才能出 厂. 现从一万件产品中任意抽查12件发现3件次 品, 问该批产品能否出厂?若抽查结果发现1件 次品, 问能否出厂? 解: 假设 这是 小概率事件 , 一般在一次试验中 是不会发生的, 现一次试验竟然发生, 故认 为原假设不成立, 即该批产品次品率 , 则该批产品不能出厂.
例 这不是小概率事件,没理由拒绝原假设, 从而接受原假设, 即该批产品可以出厂. 注1 直接算 若不用假设检验, 按理不能出厂. 注2 本检验方法是 概率意义下的反证法,故拒绝原假设是有说服力的, 而接受原假设是没有说服力的. 因此应把希望否定的假设作为原假设.
出厂检验问题的数学模型 对总体 提出假设 要求利用样本观察值 对提供的信息作出接受 (可出厂) , 还 是接受 (不准出厂) 的判断.
例 解: 反映 的大小: 成立下, 不应太大 若 就拒绝 小概率 包装机包装产品,正常情况下,每包重量服从正 态分布N(500,42). 某天开机后抽取5包检验,测 得重量: 509, 507, 498, 502, 508.问包装机产品 重量的均值是否正常? 解: 反映 的大小: 成立下, 不应太大 若 就拒绝 小概率
例 根据 确定k。 成立时 考虑 下,由 得 即 时拒绝假设 不正常
显著水平α 在假设检验中,我们需要对小概率的说法给出统 一界定,通常给出一个上限α,当一个事件发生 的概率小于α,我们认为这是小概率事件。 α常见取值 0.01, 0.05, 0.1 在假定 成立下,若根据样本提供的信息判断出 某“异常”现象(发生概率 )发生,则认为 错误 显著。称α为显著水平。
假设检验步骤 1. 根据实际问题,提出原假设 和备 择假设 ; 2. 确定检验统计量; 3. 根据显著水平 ,确定拒绝域; 1. 根据实际问题,提出原假设 和备 择假设 ; 2. 确定检验统计量; 3. 根据显著水平 ,确定拒绝域; 4. 由样本计算统计量值; 5. 结论:作出判断是否接受 。
两类错误 第一类错误: 𝑯 𝟎 为真时,我们仍有可能拒绝 𝑯 𝟎 , 此时犯了“弃真”错误 第二类错误: 𝑯 𝟎 不成立时,我们仍有可能接受 𝑯 𝟎 , 此时犯了“存伪”错误 注 第一类错误的概率就是显著水平α; 第二类错误的概率用β表示。 Neyman-Pearson原则:在控制第一类错误概率的前提下,尽量减小犯第二类错误的概率。
正态总体均值的检验:单正态总体 单正态总体 样本 均值 ,样本方差 1. 已知 (u检验) 以双边检验为例: 样本 均值 ,样本方差 1. 已知 (u检验) 以双边检验为例: 𝐻 0 : 𝜇= 𝜇 0 , 𝐻 1 :𝜇≠ 𝜇 0 取𝑈= 𝑋 − 𝜇 0 𝜎/ 𝑛 在 𝐻 0 成立的条件下,𝑈∼𝑁 0,1
正态总体均值的检验:单正态总体 拒绝域 𝑈 ≥ 𝑢 𝛼/2 或: (−∞,− 𝑢 𝛼/2 ] ∪[ 𝑢 𝛼/2 ,+∞) 拒绝域 𝑈 ≥ 𝑢 𝛼/2 或: (−∞,− 𝑢 𝛼/2 ] ∪[ 𝑢 𝛼/2 ,+∞) 计算𝑈的观测值 𝑈 ,若 𝑈 ∈ 拒绝域,则拒绝 𝐻 0 ,接受 𝐻 1 ,否则接受 𝐻 0 结论:双/单边检验的拒绝域 𝑈 ≥ 𝑢 𝛼/2 𝑈 ≤− 𝑢 𝛼 𝑈 ≥ 𝑢 𝛼 𝐻 1 : 𝜇≠ 𝜇 0 𝜇< 𝜇 0 𝜇> 𝜇 0 𝐻 0 :𝜇= 𝜇 0
例 钢铁厂正常情况下铁水的含碳量𝑋∼ 𝑁 4.55, 0.108 2 . 现观测5炉钢水,测得含碳量 4.28、4.40、4.42、4.35、4.37,问含碳量的均 值有无显著变化?(𝛼=0.05) 解:显著变化双边检验 H 0 :μ=4.55, H 1 :μ≠4.55 H 0 成立时,U= X −4.55 σ/ n ∼N(0,1) 拒绝域 U ≥ u α/2 = 1.96 X =4.364; U =−3.851∈ 拒绝域 拒绝 H 0 ,接受 H 1 ,认为有显著变化
例 解: H 0 :μ=1000, H 1 :μ<1000 H 0 成立时,U= X −1000 σ/ n ∼N 0,1 某批元件合格标准的寿命不低于1000小时,已 知元件寿命𝑋~𝑁 𝜇, 100 2 ,抽取25件,测得平 均寿命960小时,设𝛼=0.05,检验平均寿命是 否合格。 解: H 0 :μ=1000, H 1 :μ<1000 H 0 成立时,U= X −1000 σ/ n ∼N 0,1 拒绝域: U ≤− u α =−1.645 观测值 U =−2.0∈ 拒绝域 结论:拒绝 H 0 ,接受 H 1 ,认为不合格
正态总体均值的检验:单正态总体 2. 未知 (t检验) 用样本(修正)方差代替 取 T= 𝑿 − 𝝁 𝟎 𝑺n/ 𝒏−𝟏 = 𝑿 − 𝝁 𝟎 𝑺n−𝟏/ 𝒏 𝐻 0 成立时,𝑻∼𝒕 𝒏−𝟏
正态总体均值的检验:单正态总体 𝐻 0 : 𝜇= 𝜇 0 , 𝐻 1 : 𝜇≠ 𝜇 0 𝜇< 𝜇 0 𝜇> 𝜇 0 𝐻 0 : 𝜇= 𝜇 0 , 𝐻 1 : 𝜇≠ 𝜇 0 𝜇< 𝜇 0 𝜇> 𝜇 0 拒绝域 𝑇 ≥ 𝑡 𝛼 2 𝑛−1 (𝜇≠ 𝜇 0 ) 𝑇 ≤− 𝑡 𝛼 𝑛−1 (𝜇< 𝜇 0 ) 𝑇 ≥ 𝑡 𝛼 𝑛−1 (𝜇> 𝜇 0 )
例 规定某种保健品中Vc的含量不得低于21mg. 已知 每份样品中Vc含量X∼𝑁 𝜇, 𝜎 2 ,现抽取17个样品, 测得Vc含量均值为20mg,修正样本方差为15.88, 以𝛼=0.025检验这批保健品的Vc含量是否合格? 解: H 0 :μ=21, H 1 :μ<21 σ 2 未知, H 0 成立时, T= n X −21 S n−1 ∼t n−1 拒绝域: T ≤− t α n−1 =−2.1199 观察值 T =−1.036∉拒绝域 接受 H 0 ,认为合格.
正态总体均值的检验:双正态总体 正态总体 与 独立 样本 均值 ,样本方差 样本 均值 ,样本方差 1. 已知 正态总体 与 独立 样本 均值 ,样本方差 样本 均值 ,样本方差 1. 已知 𝐻 0 : 𝜇1= 𝜇 2 , 𝐻 1 : 𝜇1≠ 𝜇 2 𝜇1< 𝜇 2 𝜇1> 𝜇 2
正态总体均值的检验:双正态总体 取𝑈= 𝑋 − 𝑌 𝜎12 𝑛1 + 𝜎22 𝑛2 取𝑈= 𝑋 − 𝑌 𝜎12 𝑛1 + 𝜎22 𝑛2 在 𝐻 0 成立的条件下,𝑈∼𝑁 0,1 拒绝域 𝑈 ≥ 𝑢 𝛼 2 (𝜇1≠ 𝜇 2 ) 𝑈 ≤− 𝑢 𝛼 (𝜇1< 𝜇 2 ) 𝑈 ≥ 𝑢 𝛼 (𝜇1> 𝜇 2 ) 计算𝑈的观测值 𝑈 ,若 𝑈 ∈ 拒绝域,则拒绝 𝐻 0 ,接受 𝐻 1 ,否则接受 𝐻 0
正态总体均值的检验:双正态总体 2. 未知但相等 为自由度n+m-2的t分布 不做考试要求
正态总体方差的检验:单正态总体 单正态总体 样本 均值 ,样本方差 𝜇未知 (χ2检验) 取统计量χ2 = 样本 均值 ,样本方差 𝜇未知 (χ2检验) 𝐻 0 : σ2= σ 0 2 , 𝐻 1 : σ2≠ σ 0 2 σ2< σ 0 2 σ2> σ 0 2 取统计量χ2 = 𝑛 𝑆 𝑛 2 σ 0 2 ~ 𝜒 2 (𝑛−1) (在 𝐻 0 成立的条件下)
正态总体方差的检验:单正态总体 拒绝域 𝜒 2 ≥ 𝜒 2 𝛼 2 𝑛−1 或 𝜒 2 ≤ 𝜒 2 1− 𝛼 2 𝑛−1 , (σ2≠ σ 0 2 ) 𝜒 2 ≤ 𝜒 2 1−𝛼 𝑛−1 , (σ2< σ 0 2 ) 𝜒 2 ≥ 𝜒 2 𝛼 𝑛−1 , (σ2> σ 0 2 )
正态总体方差的检验:双正态总体 正态总体 与 独立 样本 均值 ,修正样本方差 样本 均值 ,修正样本方差 正态总体 与 独立 样本 均值 ,修正样本方差 样本 均值 ,修正样本方差 𝜇与σ均未知,比较 σ 1 2 / σ 2 2 (F检验) 𝐻 0 : σ 1 2 = σ 2 2 , 𝐻 1 : σ 1 2 ≠ σ 2 2 σ 1 2 < σ 2 2 σ 1 2 > σ 2 2
正态总体方差的检验:双正态总体 取统计量F = (在 𝐻 0 成立的条件下) 拒绝域 𝐹 ≥ 𝐹 𝛼 2 … 或 𝐹 ≤ 𝐹 1− 𝛼 2 … ,( σ 1 2 σ 2 2 =1) 𝐹 ≤ 𝐹 1−𝛼 … , ( σ 1 2 < σ 2 2 ) 𝐹 ≥ 𝐹 𝛼 … , ( σ 1 2 > σ 2 2 )
例 某种钢丝,要求其拉断力的方差不超过162。现 抽检9个样品,测得拉断力分别为289, 286, 285, 285, 286, 285, 286, 298, 296。设拉断力 。 问这批钢丝拉断力是否达标? (𝛼=0.05) 解: H 0 :σ2=162, H 1 :σ2>162 H 0 成立时,χ2 = 𝑛 𝑆 𝑛 2 16 2 ~ 𝜒 2 8 拒绝域: 𝜒 2 ≥ 𝜒 2 𝛼 8 =15.507 观察值 𝜒 2 = 162.889 162 =0.6366∉拒绝域 接受 H 0 ,认为拉断力合格.
例 设某零件的直径 ,现取16个进行测量,问 (1)能否接受直径均值为5的假设,(2)能否接受直 径方差不超过0.095的假设。 (已知 ) 设某零件的直径 ,现取16个进行测量,问 (1)能否接受直径均值为5的假设,(2)能否接受直 径方差不超过0.095的假设。 (已知 ) (𝛼=0.05)
例 解:(1) H 0 :μ=5, H 1 :μ≠5 H 0 成立时,T= 16 X −5 S n−1 ∼t 15 拒绝域: 𝑇 ≥ 𝑡 𝛼 2 15 =2.131 观察值 T = 16 78.4/16−5 0.4 =−1∉拒绝域 接受 H 0 ,认为直径均值为5
例 (2) H 0 :σ2=0.095, H 1 :σ2>0.095 H 0 成立时,χ2 = 𝑛 𝑆 𝑛 2 0.095 ~ 𝜒 2 15 拒绝域: 𝜒 2 ≥ 𝜒 2 𝛼 15 =25 观察值 𝜒 2 = 16∗0.15 0.095 =25.563∈拒绝域 拒绝 H 0 ,认为方差超过0.095
(1)关于 的检验 u 检验法 (2 已知) 检验统计量及其 原假设 备择 拒绝域 H0为真时的分布 H0 假设H1 0 0 < 0 > 0
t 检验法 (2 未知) (2)关于 的检验 原假设 H0 备择假设 H1 检验统计量及其 H0为真时的分布 拒绝域 0 0 < 0 > 0
检验法 (3)关于 2的检验 原假设 检验统计量及其在 拒绝域 H0 H0为真时的分布 备择假设 H1 2 02 2= 02 2< 02 2> 02
(4)双正态总体 的检验 原假设 H0 备择假设 H1 检验统计量及其在 H0为真时的分布 拒绝域
(5)双正态总体 的检验 检验法 原假设 H0 备择假设 H1 检验统计量及其在 H0为真时的分布 拒绝域