(四)标准差(standard deviation) 方差是用取平方后的单位来表示的, 如果原始数据用毫米汞柱表示,则方差 就是毫米汞柱的平方。在统计分析中为了 方便,通常将方差取平方根,还原成与原 始观察值单位相同的变异量度。
计算公式 (1)总体标准差: (2)样本标准差: 直接法: 或
加权法(频数表资料)
式中x和 f 分别为各组段的组中值及出现的频数。 性质:一组观察值的标准差愈大说明其变异程度愈大; 应用:适合于正态分布或近似正态分布的资料。标准差与正态分布有明确的关系,它与均数结合能够完整地概括一个正态分布。
三、变异系数 变异系数(coefficient of variation,简记为CV),又称为离散系数(coefficient of dispersion) 计算方法:
应用: a.比较度量衡单位不同的多组资料的变异程度。 b. 比较均数相差悬殊的多组 资料 的变异程度(如舒张压和收缩压 ; 儿童身高与成人身高) 。
计算器(统计功能)的使用 Casio fx-570w 型
开机: 进入统计状态: 清除内存: AC/ON SD MODE MODE 1 SHIFT Scl AC/ON =
实例1:求1,3,5的算术平均数, 标准差和方差。 1 M+ 3 M+ M+ 5 SHIFT X 求出x=3 = 1
Xσn-1 SHIFT 求出 s=2 3 = 若接着按 x2 = 则可求出 s2=4
实例2:加权法求算术平均数, 标准差和方差。 组段 组中值X 频数f 0~ 2~ 4~6 1 3 5 6 7 合计 18
SHIFT ; 1 , 5 M+ SHIFT ; 3 , 6 M+ ; SHIFT SHIFT 5 , 7 M+ 求出x=3.2222 SHIFT X = 1
Xσn-1 SHIFT 2 3 = 求出s=1.6647 若接着按 x2 = 则可求出s2=2.7712
实例3:加权法求几何均数 抗体滴度 滴度倒数x 频数f 合计 1:4 1:8 1:16 1:32 1:64 1:128 1:256 4 8 9 21 20 12 5 合计 75
SHIFT ; log 4 , 4 M+ … … … M+ SHIFT SHIFT ; log 256 4 M+ , SHIFT X 1 = 显示 1.4369
SHIFT 10x 若接着按 log = 得到
第四节 正态分布及应用
一、正态分布 简记为N(μ,σ2) 1.正态分布的概率密度函数:
2.正态分布函数:与f(x)相对应的曲线下面积分布函数为F(x),为曲线下自-∞到x面积,表达式为:
3.正态分布特征: 正态密度函数曲线在横轴上方均数处最高。 正态分布以均数为中心,左右对称。 正态分布中的X取值范围理论上没有 边界。
正态分布有两个参数,即位置参数μ和变异参数σ 。 当σ固定后,μ增大,曲线沿横轴向右 移动。 μ减小,曲线沿横轴向左
当μ固定后,σ越大,曲线的形状越“矮胖”,表示数据分布越分散; σ越小,曲线的形状越“瘦高”, 表示数据分布越集中。
正态分布曲线下的面积分布有 一定的规律。 在(μ-σ,μ+σ)内的面积约为68.27% ; 在(μ-1.96σ,μ+1.96σ)内约为95.00% ; 在(μ-2.58σ,μ+2.58σ)内约为99.00% .。
二、标准正态分布 标准正态分布(standard normal distribution)是总体均数为0、标准差为1的正态分布。简记为N(0,1) 1. 标准正态分布的概率密度函数:
2.标准正态分布函数:与φ(u)相对应的曲线下面积分布函数为Φ(u),为曲线下自-∞到u的面积,表达式为:
标准正态分布曲线下面积查表时注意 事项: (1) (μ和σ已知) (2) (μ和σ未知) 以0为中心,左右两侧曲线下对称于0的区间面积相等。
u 0.00 0.05 0.06 0.07 -2.0 -1.7 -1.6 -1.2 -1.0 -0.3 -0.2 0.0228 0.0548 0.1151 0.1469 0.4013 0.0392 0.3557
三、正态分布的应用 (一)估计频率分布 (二)确定医学参考值范围 医学参考值范围(reference value range)传统上称正常值范(normal range),指正常人(或动物)的解剖、生理、生化、免疫等各种数据的波动范围。
所谓的“正常人”不同于“健康人”,绝对健康是不存在的,而是指排除了影响被研究指标的疾病和有关因素的同质人群。 1.选择足够数量的正常人(或动物)作为参照样本。 一般认为至少应在120例以上。例数过少,确定的参考值范围往往不够准确。
所谓正常不是指机体任何器官、组织的形态和机能都正常的人,而是指符合特定健康水平的人,它必须要考虑可能影响所要制定参考值范围指标的各种疾病及干扰因素,将这些人排除在外。 2.对选定的正常人进行准确的测量
3.决定取单侧范围还是双侧范围值。 例:肺活量 〉下限 甘油三酯,尿糖,尿铅 〈上限 血清总胆固醇,红(白)细胞数下限< X<上限 4.选择适当的百分范围。 所谓的“绝大多数”究竟是多少,取决于资料的性质和研究的目的所规定的百分界限。 最常用的百分界限是95%
若主要目的在减少假阳性(如用于确诊病人),参考值范围的百分数范围要取大一些(如95%或99%);反之,若主要目的在减少假阴性(如用于初筛病人),百分数范围可以小一些(如90%或80%)。
5.估计参考值范围的界限 (1)百分位数法 应用:适用于任何分布,特别是偏态分布的资料。 公式:双侧1-α参考值范围 P100α/2 ~P100-100α/2 单侧1-α参考值范围 >P100α 或 <P100-100α
表2.5 参考值范围所对应的百分位数 百分范围 % 单侧 双侧 只有下限 只有 上限 下限 95 P5 P95 P 2.5 P 97.5 表2.5 参考值范围所对应的百分位数 百分范围 % 单侧 双侧 只有下限 只有 上限 下限 95 P5 P95 P 2.5 P 97.5 99 P1 P99 P 0.5 P 99.5
(2)正态分布法 应用:正态分布或近似正态分布 或经变量变换服从正态分布。 公式:双侧1-α参考值范围 单侧1-α参考值范围 〉 或 〈
表2.5 参考值范围所对应的正态分布区间 百分 范围 % 单 侧 双侧(对称) 只有 下限 上限 95 99
(三)质量控制 上、下警戒线 上、下控制线 (四)正态分布是很多统计方法的 理论基础