The application of medical statistics methods 医学统计学方法应用 The application of medical statistics methods
统计资料类型 计数资料 定量资料 计量资料 统计资料 分类资料 定性资料 等级资料
统计资料类型 定量资料(数值变量资料): 1.计数资料(离散型变量)--变量值只能取整数 例:某山区100名孕妇产前检查次数: 0,2,4,1,5,3,……5,6。 2.计量资料(连续型变量)--变量值可以取实数轴上的任何值 例:某地区小学生的身高、体重等 抽样调查某地120名居民血清中铁含量(μmol/L): 4.21, 3.32, 5.35, …… 3.95, 3.92, 3.58
统计资料类型 定性资料(分类变量资料): 1. 分类资料(分类变量或名义变量) 2. 等级资料(有序变量或等级变量) 例:调查对象基本情况:性别、职业 性别:男性和女性—1和2表示; 职业:工人、教师和学生--1、2和3表示。 2. 等级资料(有序变量或等级变量) 例:病人某种疾病的恢复程度:痊愈、好转和无效; 医院检验科的某些指标:+、++和+++
数据资料的分析 定量资料 定性资料 统计描述 相互关系 统计图表 分析资料 参数估计 统计推断 假设检验
统计描述 1.定量资料(计量资料) 集中趋势指标: 2.定性资料 率、构成比和相对比--率的标准化 3. 相互关系 直线相关和回归 离散趋势指标: 2.定性资料 率、构成比和相对比--率的标准化 3. 相互关系 直线相关和回归 4.统计图表 直条图、直方图、百分条图、圆图和线图
统计推断 1. 参数估计 用样本指标(统计量)估计总体指标(参数)。 a. 点估计: 用样本统计量直接作为总体参数的点估计值。 例: 120名成年男子血清铁含量的均数是18.57。那么,该总体范围(这个地区)的成年男子血清铁含量的均数就是18.57。这种方法虽简单,但未考虑抽样误差,一般不用。
统计推断 参数估计 b. 区间估计(1-α置信区间,CI): 按一定的可信度,用样本均数和均数的标准 误估计总体均数的置信区间,或用样本频率及其 标准误估计总体概率的置信区间(可能范围)。 可信度:给定的概率称为可信度。 用1-α表示,通常取95% 、 99%。
总体均数的置信区间 t分布法 应用条件:总体方差未知,样本量小 单侧置信区间 或
例 某医师测的40名老年性慢性支气管炎病人尿中17-酮类固醇排出量均数为15. 19umol/d,标准差为5 例 某医师测的40名老年性慢性支气管炎病人尿中17-酮类固醇排出量均数为15.19umol/d,标准差为5.03umol/d,试估计该种病人尿17-酮类固醇排出量总体均数的95%可信区间。 分析条件:总体方差未知,样本量小 (13.58~16.80)
正态分布近似法 1.应用条件:当总体标准差已知时 2.总体标准差未知,而样本量较大时(n>50) 单侧置信区间 或 或
正态分布图形 -1 1 -1.96 1.96 -2.58 2.58 68.27% 95.00% 99.00%
假设检验中单侧检验与双侧检验 1.699 -2.045 2.045
例4.3 某市随机抽查12岁男孩100人,得身高均数139.6cm,标准差6.85cm。计算该地12岁男孩身高均数的95%的可信区间。 分析条件:总体方差未知,但样本量大,用正态分布法
总体概率的置信区间 1.查表法 2.正态近似法 条件:n足够大,且样本频率p和(1-p)均不太小。
例 用某种仪器检查已确诊的乳腺癌患者120名,检出乳腺癌患者94例,检出率为78.3%。估计该仪器乳腺癌总体检出率的95%置信区间。 例 用某种仪器检查已确诊的乳腺癌患者120名,检出乳腺癌患者94例,检出率为78.3%。估计该仪器乳腺癌总体检出率的95%置信区间。 分析条件:n比较大,且np=94及n(1-p)均大于5。 (0.709, 0.857)
统计推断 步骤 2.假设检验 (1)选择检验方法 建立检验假设 H0:μ=μ0;H1:μ≠μ0 确定检验水准:α=0.05 (2) 计算统计量 (3) 确定P值 (4) 推断结论 P≤α P>α 拒绝H0,接受H1, 差别有统计学意义。 不拒绝H0, 差别没有统计学意义。
假设检验方法 1. 参数检验方法(parametric test) 2. 非参数检验方法(nonparametric test) 不考虑总体分布类型,而对总体分布特征或分布位置进行检验。亦称任意分布检验。如: 秩和检验 在实际应用中,对符合参数检验的资料,或经变量变换后符合参数检验的资料应首选参数检验;对不能满足参数检验条件的资料,应选用非参数检验。
t 检验 概念和用途 t 检验的类型 以t分布为基础的检验称为t检验。
单样本t检验 试验设计 一组样本均数(代表未知总体均数)与已知总体均数(一般为理论值、标准值或经过大量观察所得稳定值等)的比较。 应用条件:样本来自正态分布的总体!
例:根据大量调查,已知健康成年男子的脉搏均数为72次/分。某医生在某山区随机调查30名健康男子,求得脉搏均数为74. 2次/分,标准差为6 例:根据大量调查,已知健康成年男子的脉搏均数为72次/分。某医生在某山区随机调查30名健康男子,求得脉搏均数为74.2次/分,标准差为6.5次/分。能否认为该山区的成年男子的脉搏均数高于一般成年男子的脉搏均数? 1. 建立检验假设,确定检验水准 2. 确定检验方法,计算统计量 3. 确定P值并做出推断结论 查t界值,得到t值为2.045<1.854,则P>0.05。拒绝H1,接受H0,差异无统计学意义。尚不能认为该山区成年男子脉搏数与一般男子不同。
配对样本t检验 试验设计(配对设计) 配对类型 为了控制可能存在的主要非处理因素,将受试对象 应用条件:差值服从正态分布! 按照某些重要特征(主要是非处理因素)配成对子,每 对中的两个受试对象随机分配到两处理组。 配对类型 1. 同一受试对象处理前后的结果; 2. 同一受试对象或同一份样品分成两份,随机分别 接受不同处理; 3. 比较将受试对象配成特征相近的对子,随机接受 两种处理。 应用条件:差值服从正态分布!
配对设计原理: 应用条件:差值服从正态分布! 配对设计下的数据具有一一对应的特征,人们关 心的变量是对子的效应差值而不是各自的效应值。把两 种处理后的数据之差看作处理效果的一个样本,假定这 种差值服从正态分布,那么其总体均数为0,即表明该 处理没有作用。问题转化为单组完全随机化设计资料总 体均数为零的检验。 应用条件:差值服从正态分布!
例 12名接种卡介苗的儿童,8周后用两批不同结核菌素,一批是标准结核菌素,一批是新制结核菌素,分别注射在儿童的前臂,两种结核菌素的皮肤浸润反应平均直径如下表,问两种结核菌素的反应性有无差别? 编号(1) 标准品(2) 新制品(3) 差值d(4)=(2)(3) 1 12.0 10.0 2.0 2 14.5 4.5 3 15.5 12.5 3.0 4 13.0 -1.0 … 8 7.5 6.5 1.0 9 8.0 5.5 3.5 10 15.0 7.0 11 12 10.5 9.5 39/12=3.25
假设检验的步骤 1. 建立检验假设,确定检验水准; 2. 计算统计量; 3. 确定P值并做出推断结论
两独立样本t检验 试验设计(完全随机设计) 将受试对象完全随机地分配到两组中,分别接 应用条件 目的:比较两总体均数是否相同。 受不同的处理;或者从两个总体完全随机地抽取一部 分个体进行研究。 目的:比较两总体均数是否相同。 应用条件 独立样本,两样本含量较小(n<60); 两样本来源于正态分布的总体; 两总体方差相同,即方差齐性。
方差齐性时
方差不齐时 检验统计量为: 校正自由度:
例 有25例糖尿病患者随机分成2组,甲组单纯用药物治疗,乙组采用药物治疗合并饮食疗法,2个月后测空腹血糖(mmol/L),问两组血糖值是否相同? t=2.639 t0.05(23)=2.069 15.21 10.85
例 有两组小白鼠分别饲以高蛋白和低蛋白饲料,4周后记录小白鼠体重增加量(g)如下表,问两组动物体重增加量的均数是否相等?
完全随机设计两样本几何均数比较的t检验 基本思想:某些资料不服从正态分布,两样本所代表的总体方差也可能不齐,但进行变量变换后(对数变换),则服从正态分布,相应的两总体方差也可能具有齐性。数据变换后两组间的关系并没有改变。
选甲型流感病毒血凝抑制抗体滴度(倒数)小于5者24人,随机 分为2组,每组12人。用甲型流感病毒活疫苗进行免疫,一组 用气雾法,另一组用鼻腔喷雾法,免疫一个月后,分别测定血 凝抑制抗体滴度,结果如下表,问两种方法免疫的效果有无差 别?
t检验的应用条件是: ①正态总体 ②方差齐性(独立样本资料) 正态性检验的方法: 方差齐性检验的方法: χ2拟合优度检验。 P-P图;Q-Q图;W检验;D检验; χ2拟合优度检验。 方差齐性检验的方法: F检验;Bartlettχ2检验;Levene检验。
P-P图法: 以样本的实际累计频率(百分比)作为横坐标,以按照正态分布计算的相应的理论累计概率作为纵坐标,把样本值表现为直角坐标平面中的散点。所得的散点图称为P-P图。如果资料服从正态分布,样本点应围绕第一象限的对角线散布。
Q-Q图法: 以样本的实际分位数(PX)作为横坐标,以按照正态分布计算的相应的理论分位数作为纵坐标,把样本值表现为直角坐标平面中的散点。所得的散点图就是Q-Q图。如果资料服从正态分布,样本点应围绕第一象限的对角线散布。 目前统计学软件主要提供P-P图或Q-Q图。
方差齐性检验方法: F检验 查F界值表并做出推断
附表3
方差分析(F检验) 方差分析的基本思想 将全部观察值的总变异,按设计和需要(影响因素)分解成两个或多个组成部分,构造出反映各部分变异的统计量,之后构造假设检验统计量F,实现对总体均数的推断。
方差分析的类型和应用 方差分析的类型: 应用条件: 1. 完全随机设计的方差分析; 2. 随机区组设计的方差分析; 3. 多个样本均数的多重比较。 应用条件: 1. 各样本是相互独立的随机样本; 2. 各样本来自正态总体; 3. 各处理组总体方差相等,即方差齐性。
完全随机设计的方差分析 试验设计 将研究对象随机分为m组(m≥3),每组内个体分别接受不同的处理因素。 例:某医生为研究一种四类降糖新药的疗效,选择了60名II型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临床试验。其中,降糖新药高剂量组21人、低剂量组19人、对照组20人。对照组服用公认的降糖药物,治疗4周后测得其餐后2小时血糖的下降值(mmol/L)结果如下表:问治疗4周后餐后血糖下降值各组的平均水平是否不同?
n=21 n=19 n=20 5.8000 9.1952 5.4300 6.8650
分析资料的基本情况 总变异的分解: 处理因素:不同方式给(降糖)药 因素水平:降糖新药高剂量组、降糖新药低剂量组、对照组(公认降糖药物) 观测指标:餐后2小时血糖下降值 目 的:通过比较不同组给药方式后餐后2小时血糖下降值存在的差异,从而判断不同剂量新药和对照药物治疗2型糖尿病患者的疗效是否相同。 总变异的分解: SS总=SS组间+SS组内,自由度ν总=ν组间+ν组内 统计量:F=MS组间/MS组内
SS总=SS组间+SS组内,且ν总=ν组间+ν组内 试验数据中存在的变异 总变异、组间变异和组内变异 总变异(SS总): 全部测量值 与总均数 间的差别 ,反映了所有测量值之间总的变异程度。 组间变异(SS组间): 各组的均数 与总均数 间的差异。SS组间反映了各组均数 间的变异程度 组内变异(SS组内): 每组的原始数据与该组均数 的差异。 SS总=SS组间+SS组内,且ν总=ν组间+ν组内
基本步骤: 1. 建立检验假设 H0:μ1=μ2=μ3,即三个总体均数全相等 2. 计算检验统计量F值。 检验水准α=0.05 2. 计算检验统计量F值。
3. 确定P值,作出推断结论 查F界值表,按α=0.05水准,拒绝H0,接受H1,差异有统计学意义。
随机区组设计资料的方差分析 试验设计 先按某因素(对试验结果有影响,非处理因素)将研究对象分组,每组内个体再随机分组并接受不同的处理因素。 先按某因素(对试验结果有影响,非处理因素)将研究对象分组,每组内个体再随机分组并接受不同的处理因素。 例 将36只雌性大白鼠按月龄相同、体重相近分为12组,经一段时间注射不同剂量雌激素后的子宫质量如下表。 试问 1. 不同区组的大鼠间子宫质量是否相同? 2. 接受不同剂量注射的大鼠子宫质量是否相同?
分析资料的基本情况 变异的分解: 处理因素:注射雌激素 因素水平:0.2mg 0.4mg 0.8mg 区组因素:体重、月龄,对实验的结果会产生影响,但是是非处理因素 因素水平:12个 观测指标:大鼠子宫重量 目 的:通过比较不同组大鼠子宫质量存在的差异,从而判断不同雌激素剂量和不同大鼠体重、月龄对子宫质量影响是不同的。 变异的分解: SS总=SS区组+SS处理组+SS误差 且ν总=ν区组+ν处理组+ν误差 统计量:F1=MS处理/MS误差 且ν1=ν处理 ;ν2 =ν误差 统计量:F2=MS区组/MS误差 且ν1=ν区组 ;ν2 =ν误差
基本步骤: 1. 建立检验假设 2. 计算检验统计量F1、F2 对于处理组: H0:三个总体均数全相等; H1:三个总体均数不全相等。 对于区组: H0:12个区组的总体均数全相等; H1:12个区组的总体均数不全相等。 检验水准:α=0.0 2. 计算检验统计量F1、F2
方差分析结果 3. 确定P值,作出推断结论 查F界值表,按α=0.05水准,对不同剂量,p<0.05,拒绝H0,接受H1,差异有统计学意义;针对不同区组p>0.05,不拒绝H0,差异没有统计学意义。
多个样本均数的多重比较 “多重比较”的几种方法 不拒绝H0,表示拒绝总体均数相等的证据不足 分析终止。 拒绝H0,接受H1, 表示总体均数不全相等 哪两两均数之间相等? 哪两两均数之间不等? 需要进一步作多重比较。 “多重比较”的几种方法 方差齐性条件下: 常用的有LSD法、 SNK法、Tukey法和Duncan法。 方差不齐条件下: 常用Dunnett’s T3 和Dunnetts’s C法
卡方检验 2检验以2分布为理论依据。 2分布是一种连续型随机变量的概率分布。
卡方检验 检验的基本思想 检验的统计量基本公式为: 检验实际频数(A)和理论频数(T)的差别是否是由抽样误差引起的,也就是由样本率(或样本构成比)来推断总体率(或构成比)的差别是否是由抽样误差引起的。理论频数与实际频数的吻合程度。 检验的统计量基本公式为:
卡方检验 检验的类型: 完全随机设计两组频数分布资料; 完全随机设计多组频数分布资料; 配对设计下两组频数分布资料。 检验的应用: 用于分类变量(计数)资料的统计推断 ,检验两个(或多个)率或构成比之间差别是否有差异。
完全随机设计两组频数资料 二分类—2×2列联表 完全随机设计两组频数资料 二分类—2×2列联表 四格表资料的基本形式 完全随机设计下两组频数分布的四格表 处理 属性 合计 阳性 阴性 1 A11(T11) A12(T12) n1 2 A21(T21) A22(T22) n2 m1 m2 n 1. n≥40 2. n≥40且1≤T<5时
完全随机设计两组频数资料 二分类—2×2列联表 完全随机设计两组频数资料 二分类—2×2列联表 完全随机设计下两组频数分布的四格表 处理 属性 合计 阳性 阴性 1 a b a+b 2 c d c+d a+c b+d n 四格表专用公式 1. n≥40 2. n≥40且有某个格子出现1≤T<5 3. T<1或 n<40:四格表确切概率法
完全随机设计两组频数资料 二分类—2×2列联表 完全随机设计两组频数资料 二分类—2×2列联表 例 某药品检验所随机抽去574名成年人,研究某抗生素的耐药性,其中179例未曾使用该抗生素,其耐药率为40.78%;而在395例曾用过该药的人群中,其耐药率为45.57%。问两种人群的耐药率是否一样? 表 某抗生素的人群耐药性情况 用药史 耐药 不耐药 合计 耐药率(%) 曾服该药 180(174.10) 215(220.90) 395 45.57 未服该药 73(78.90) 106(100.10) 179 40.78 253 321 574 44.08
1. 建立假设检验 2. 计算检验统计量 3. 确定P值并做出推断结论 自由度ν=1,查χ2界值表,得 ,所以 H0:两种人群对该抗生素的耐药率相同,即π1=π2; H1:两种人群对该抗生素的耐药率不相同,即π1≠π2 。 检验水准α=0.05 2. 计算检验统计量 利用四格表专用公式计算:χ2=1.15 3. 确定P值并做出推断结论 自由度ν=1,查χ2界值表,得 ,所以 P>0.05,不拒绝H0,差别没有统计学意义。认为两种人群 对该抗生素耐药性没有差异。
完全随机设计两组频数资料多分类情形—2×C列联表 处理 属性 合计 1 2 … C A11(T11) A12(T12) A1C(T1C) n1 A21(T21) A22(T22) A2C(T2C) n2 m1 m2 mC n 统计量:
孕方法情况如表所示,试分析该地城市和农村避 孕方法的总体分布是否有差异。 例: 1986年某地城市和农村20至40岁已婚妇女避 孕方法情况如表所示,试分析该地城市和农村避 孕方法的总体分布是否有差异。 某地城市和农村已婚妇女避孕方法情况 地区 避孕方法 合计 节育器 服避孕药 避孕套 其他 城市 153 33 165 40 391 农村 320 75 43 18 456 473 108 208 58 847
1. 建立检验假设 2. 计算统计量 3. 确定P值并做出统计推断 H0:城市和农村已婚妇女避孕方法的总体构成分布相同; 检验水准α=0.05。 2. 计算统计量 3. 确定P值并做出统计推断 查χ2界值表得, ,P<0.005, 按α=0.05检验水准拒绝H0。认为城市和农村已婚妇女避 孕方法的总体构成不同。
完全随机设计下多组频数分布资料 统计量: 完全随机设计下两组频数分布的R×C表 处理 属性 合计 1 2 … C A11(T11) A1C(T1C) n1 A21(T21) A22(T22) A2C(T2C) n2 R AR1(TR1) AR2(TR2) ARC(TRC) nR m1 m2 mC n 统计量:
例:为研究某镇痛药的不同剂量镇痛效果是否 有差别,研究人员在自愿的原则下,将条件相 似的53名产妇随机分成三组,分别按三种不同 剂量服用该药,镇痛效果如下表。 某药不同剂量的镇痛效果 剂量(mg) 镇痛效果 合计 有效率(%) 有效 无效 1.0 3(7.36) 12(7.64) 15 20.00 2.5 11(9.81) 9(10.19) 20 55.00 5.0 12(8.83) 6(9.17) 18 66.67 26 27 49.06
1. 建立检验假设 2. 计算统计量 3. 确定P值并做出统计推断 H0:三种剂量镇痛有效率相同; 检验水准α=0.05。 2. 计算统计量 χ2=7.584, 自由度ν=(3-1)(2-1)=2 3. 确定P值并做出统计推断 查χ2界值表, ,P<0.05,按α=0.05水准, 拒绝H0,差别有统计学意义,认为三种剂量镇痛有效率有差别。 对于多组独立样本的χ2检验,拒绝H0,只能说各 组总体概率不全相同,即多组中至少有两组的有效率 不同,但并不是多组有效率彼此之间均不相同。 若要明确哪两组间不同,需进一步作多组间的两 两比较。
多组间的两两比较 1. 样本例数较少:四格表确切概率法 2.卡方分割法: 在进行多组频率的两两比较时,将增大Ⅰ类错误的机会,这时不能再用原来的检验水准α=0.05作为是否拒绝H0的标准,需根据比较的次数修正检验水准α’。 这里的α为原来的检验水准,N为要进行两两比较检验所需的次数,k为参加检验的组数。
例 某医院用三种方案治疗急性无黄疸型病毒肝炎254例,观察结果如下表,试比较三种疗法的有效率是否一样? 表 三种疗法治疗结果 组别 有效 无效 合计 有效率 西药组 51 49 100 54.00 中药组 35 45 80 43.75 中西药结合组 59 15 74 79.73 145 109 254 57.09 结果显示,P<0.05,拒绝H0,差别有统计学意义,认为三种疗法的有效率不同。但究竟哪两组之间的有效率有差别,须进一步作两两比较(采用卡方分割法)。
两两分割后的2×2表格 本例k=3,检验次数N=N3(3-1)/2=3,校正检验水准α’=0.05/3=0.017。
α为原来的检验水准,k为参加检验的组数。 多个试验组与同一对照组的比较 在多个率的χ2检验中,经常遇到多个实验组均与同一对照组比较的情况。这时,多个实验组与同一对照组之间的比较,校正检验水准为: α为原来的检验水准,k为参加检验的组数。
例 现有三种药物,欲研究其治疗心绞痛的疗效,另设一组安慰剂作对照。试问各组间的心绞痛缓解率是否相同? 调整后的检验水准:
配对设计频数分布资料 二分类--2×2列联表 统计量: 配对设计两个变量阳性率比较 变量1 变量2 合计 阳性 阴性 a b n1 c d m1 m2 n 统计量:
,P <0.05,按α =0.05水准,拒绝H0,差别有统计学意义,认为两种培养基上白喉杆菌生长的阳性概率不相等。 例 设有56份咽喉涂抹标本,把每份标本一分为二,依同样的条件分别接种于甲乙两种白喉杆菌培养基上,观察白喉杆菌的生长情况,结果如下表,问两种培养基上白喉杆菌的生长概率有无差别? 表 两种培养基白喉杆菌生长情况 甲培养基 乙培养基 合计 生长 不生长 22 18 40 2 14 16 24 32 56 b+c=20<40,选择统计量计算公式为: ,P <0.05,按α =0.05水准,拒绝H0,差别有统计学意义,认为两种培养基上白喉杆菌生长的阳性概率不相等。
配对设计频数分布资料 多分类--R×R列联表 处理 属性 合计 1 2 … R A11 A12 A1R n1 A21 A22 A2R n2 AR1 AR2 ARR nR m1 m2 mR n 统计量 ν=k-1
例:对150名冠心病患者用两种方法检查室壁收缩运动情况,检测结果如下表,试比较两种防范测定结果的概率分布有无差别? 甲法 乙法 合计 正常 减弱 异常 60 3 2 65 42 9 51 8 17 34 68 54 28 150
查χ2界值表得, ,P>0.05,拒绝H0故不能认为甲方测定结果的概率分布于乙法测定结果的概率分布相同。 1. 建立假设检验 H0:两变量的概率分布相同 H1:两变量的概率分布不相同 检验水准α=0.05 2. 计算检验统计量 T=1.60,v=2 3. 确定P值并做出统计推断 查χ2界值表得, ,P>0.05,拒绝H0故不能认为甲方测定结果的概率分布于乙法测定结果的概率分布相同。
注意事项 不应把χ2检验视为分析R×C表资料的万能工 具,应根据R×C表中两个变量的性质、分析目的和 理论频数小于5的格子数的多少,选用相应的统计分 析方法 。 1. 行×列χ2检验时,要求理论数不小于5,若有1/5的理论频数小于5,结论不可靠,检验采用确切概率法。 2. 行×列χ2检验中,如果资料的指标分组(行变量)是有序的,χ2检验的结果只是说明各组构成比的差异有统计学意义,其结论必须结合医学实际来确定。 3. 有些行×列资料不能用行×列χ2检验,这种资料的特点是双向均按等级分类,且分类属性相同。
双项无序列联表 欲分析不同分组测量指标的分布构成是否有差别,可做χ2检验;欲分析行指标与列指标有无相关关系以及相关程度,可做χ2检验并求列联(相关)系数
单项有序 (1)分组变量无序,结果变量有序,欲分析不同组疗效有无程度上的差别-----秩和检验; (2)分组变量有序,结果变量无序,欲分析不同组的观察结果的分布构成有无差异----卡方检验。
双向有序属性不同 欲分析2个分类变量有无相关关系则等级相关分析 如果要分析不同年龄组眼晶体混浊程度的分布构成有没有差别,此时可看作单项有序列联表(年龄无序)而做秩和检验。
双向有序且属性相同 一致性检验或称Kappa检验
多个构成比的比较 2=297.56
多个样本率的比较 例8.7 某研究人员欲研究某中药治疗失眠的效果,将122名患者随机分成三组,分别服用该新药、传统治疗失眠药和安慰剂,并跟踪观察三组患者的治疗情况,试问三种药物的疗效是否一样? 2=40.05
秩和检验 基本思想 混合编秩----分组求秩和----检验 秩次(rank),秩统计量 秩和(rank sum) 指全部观察值按数值大小顺序排列的位序。 秩和(rank sum) 同组秩次相加求和。
秩和检验适用资料 单样本t检验(正态分布) 配对样本t检验(差值满足正态分布) 两独立样本t检验(正态分布、方差齐性) 完全随机设计方差分析(正态分布、方差齐性) 随机区组设计方差分析(正态分布、方差齐性) 等级资料 当上述统计方法所对应的条件不满足时,采用秩和检验?
秩和检验类型 配对资料和单样本资料 完全随机设计两组独立样本资料 完全随机设计多组独立样本资料 随机区组设计资料(Friedman M检验)
配对资料和单样本资料 配对资料秩和检验的基本思想: 单样本资料秩和检验的基本思想: (Wilcoxon秩和检验) 用于推断配对资料的差值d是否来自中 位数为零的总体。 单样本资料秩和检验的基本思想: 检验总体中位数是否等于某已知数值。
配对样本资料秩和检验的基本步骤 1. 检验假设 H0:差值的总体中位数为0;H1:差值的总体中位数不为0。 2. 编秩 检验水准: =0.05。 2. 编秩 按差值绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,差值为0舍去不计;若差值的绝对值相等,称为相持,取平均秩次。 3. 求秩和并确定统计量T 将所排的秩次冠以原差数的符号,分别求出正、负差值秩次之和,分别以T+和T-表示。 4. 统计量 双侧检验时,以绝对值较小者为统计量T值;单侧检验时,任取正差值的秩和或负差值的秩和为统计量T。 5. 确定P值和作出推断结论 查T界值表;正态近似法。
其中,tj为第j(j=1,2…)次相持所含相同秩次的个数。 1.查表法(5≤n ≤ 50):T界值表(配对比较的秩和检验) T 在范围之外,P<0.05;T 在范围之内,P>0.05; 2. 正太近似法(n>50) a. 统计量 b. 当n不是很大时,统计量Z需作调整 c. 若多次出现相持现象(如超过25%),采用如下公式校正统计量Zc 其中,tj为第j(j=1,2…)次相持所含相同秩次的个数。
例 临床医生研究白癜风病人的IL-6指标在白斑部位与正常部位有无差异,资料如下表: 本例秩和T+=33,T-=3。配对时任取T。 查表 取T=3,恰好落在界点上,所以P<0.05,按0.05水准,拒绝H0,可以认为白斑部位与正常部位的白介素有差异。
表 12名工人尿氟含量(mmol/L)测定结果 现在该地某厂随机抽取12名工人,测得尿氟含量, 结果如下表,问该厂工人的尿氟含量是否高于当地 正常人? 表 12名工人尿氟含量(mmol/L)测定结果 尿氟含量 差值d 秩次 2.15 2.62 0.47 6 2.10 -0.05 -2.5 2.72 0.57 7 2.20 0.05 2.5 2.99 0.84 8 2.12 -0.03 -1 3.19 1.04 9 2.42 0.27 4 3.37 1.22 10 2.52 0.37 5 4.57 11 T+=62.5 T-=3.5
若多次出现相持 (如超过25%),采用如下公式校正统计量Zc。 完全随机设计两组独立样本资料(Wilcoxon秩和检验) 目的:推断两样本分别代表的总体分布是否不同。 1.建立检验假设 H0: A、B两样本来自相同总体;H1: A、B两样本来自不同总体。 检验水准α=0.05 2.确定P值和作出推断结论 a.查表法: (设n1<n2)当n1≤10且n2-n1≤10时,查T界值表(两样本比较的秩和检验)。 判断原则:T 在范围之外,P<0.05; T 在范围之内,P>0.05 b.正太近似法: 若当n1>10或n2-n1>10 ,超出附表范围,可用正态近似法作Z检验。 若多次出现相持 (如超过25%),采用如下公式校正统计量Zc。
表 有无淋巴细胞转移对胃癌患者生存时间的影响 例 对无淋巴细胞转移与有淋巴细胞转移的胃癌患者,观察其生存时间,问两组患者的生存时间是否不同? 两组连续变量资料 表 有无淋巴细胞转移对胃癌患者生存时间的影响 无淋巴细胞转移 有淋巴细胞转移 时间 秩次 12 4.5 5 1 25 10 8 2 27 11 29 12.5 38 17 42 19 7 46 20 21 24 9 56 23 60 30 14 34 15 36 16 40 18 48 22 n1=10 T1=162 n2=14 T2=138 根据例题, n1=10,n2=14 当n1 ≤ 10且n2-n1≤10时, 查T界值表得: 取较小样 本量者为统计量T=162, 恰好落在界点外,所以 P<0.05,按0.05水准,拒 绝H0,即两组患者的平均 生存时间不同。
两组有序变量资料的秩和检验 例 44例健康人与24例慢性气管炎病人痰液嗜酸性细胞数的测量值如下,问健康人与慢性气管炎病人痰液嗜酸性粒细胞数有无显著性差别? 统计量:
完全随机设计多组独立样本资料(Kruskal-Wallis秩和检验) 基本步骤: 1. 建立检验假设 H0:几个总体的分布相同; H1:几个总体的分布不全相同; 检验水准:α=0.05 2. 编秩 将各组数据混合,由小到大排序并编秩 3. 求秩和 分别将各组秩次相加 4. 计算统计量
完全随机设计多组独立样本资料(Kruskal-Wallis秩和检验) 5. 确定P值并做出推断结论 a. 当组数k=3,每组例数ni≤5,查H界值表得到P值; b. 当不满足a时,H近似服从自由度为ν=k-1的χ2分 布,可查χ2界值表得到P值。 若相持较多(如超过25%),则需计算校正值Hc 。
多组连续变量资料 例 某研究者欲研究A、B两个菌种对小鼠巨噬细胞吞噬功能的激活作用,将60只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬细胞吞噬功能的监测方法,获得三组的吞噬指数,试比较三组吞噬指数有无差别?
1.建立检验假设 H0: 各组鼠脾DNA含量的总体分布相同; 2. 编秩 将各组数据混合,由小到大排序并编秩 检验水准 =0.05 2. 编秩 将各组数据混合,由小到大排序并编秩 3. 求秩和 分别将各组秩次相加 3. 根据题目选择合适的计算统计量的方法 采用H统计量公式计算 4. 确定P值并做出推断结论 查自由度ν=3的χ2界值表得, P<0.05,拒绝H0,差别有统计学意义。
多组有序变量资料 例 四中疾病患者痰液内嗜酸性粒细胞的检查结果 如下表。问四种疾病患者痰液内嗜酸性粒细胞的等级 分布有无差别?
1. 建立检验假设 2. 编秩 3. 求秩和 4. 计算检验统计量H 5. 确定P值 H0:四种疾病患者痰液内嗜酸性粒细胞总体分布相同; 检验水准α=0.05。 2. 编秩 混合编秩,先计算各等级的合计,再确定秩次范围及平均 秩次。 3. 求秩和 4. 计算检验统计量H 由于相持较多,故需校正Hc。 5. 确定P值 查自由度为ν=3的χ2界值表得, P<0.05, 拒绝H0,差别有统计学意义,认为不同疾病患者痰液内的嗜酸 性粒细胞分布不全相同。
随机区组设计资料 (Friedman秩和检验) 基本步骤: 1. 建立检验假设 H0: 各组总体分布相同; H1: 各组总体分布不全相同; 检验水准α=0.05。 2. 编秩 先将各区组内数据由小到大编秩,再将各处理组的秩次相 加,得到各处理组秩和Rj。 3. 计算统计量M值
随机区组设计资料 (Friedman秩和检验) 4. 确定P值并做出推断结论 a. 查表法(b≤15,k≤15),查M界值表。 b.χ2分布近似法:当处理数k或区组数b超出M界值表的范围时。 统计量计算公式为: 当各区组间相持较多时,用下式校正:
例 8名受试对象在相同实验条件下分布接受4中不 同频率声音的刺激,他们的反应率(%)资料如下表。问4种频率声音刺激的反应率是否有差别?
1. 建立假设检验 2. 编秩,求秩和 3. 计算统计量M值 4. 确定P值并作出推断结论。 H0: 4种频率声音刺激的反应率总体分布位置相同; H1: 4种频率声音刺激的反应率总体分布位置不全相同; 检验水准:α=0.05。 2. 编秩,求秩和 3. 计算统计量M值 4. 确定P值并作出推断结论。 b=8,k=4,查M界值表得M0.05=105<199.5,P<0.05,拒绝H0,差异有统计学意义。认为4种频率声音刺激的反应率有差别。
多个样本间的多重比较 无论是对完全随机设计多个样本比较,还是对随机化区组设计比较的秩和检验,当推断结论为拒绝H0,接受H1时,只能得出各总体分布位置不同或不全相同的结论,但不能说明任两个总体分布不同。若要对每两个总体分布作出有无不同的推断,需要作组间的多重比较。
完全随机设计多个样本间的多重比较 基本步骤: 1. 检验假设 H1:第i组与第j组所代表的总体中位数不等; 检验水准α=0.05。 2. 计算检验统计量 计算Ri和Rj的秩和,求其平均秩和分别为 a. 精确法:样本含量较小,采用两样本秩和检验的方法。
完全随机设计多个样本间的多重比较 3. 确定P值并作出推断结论 b. 正态近似法:样本含量较大,计算统计量。 当相持的个数较多时(大于25%),用校正值 3. 确定P值并作出推断结论
检验水准的调整 对k个样本反复两两比较,会增加第一类错 误的概率。 1. 多组间的两两比较 2. 实验组与同一个对照组的比较
完全随机设计多个样本间的多重比较 例 某研究者欲研究A、B两个菌种对小鼠巨噬细胞吞噬功能的激活作用,将60只小鼠随机分为三组,其中一组为生理盐水对照组,用常规巨噬细胞吞噬功能的监测方法,获得三组的吞噬指数,试比较三组吞噬指数有无差别?
随机区组设计资料的多重比较 随机区组设计资料的多重比较与完全 随机设计多个样本间的多重比较类似。
单变量常用统计方法总结
本章小结 (此处只总结了完全随机设计)
两变量关联性分析 在医学研究中需要对两个随机变量之间的关系 进行量化的研究: Ⅰ 确定两个变量间有否联系及联系程度如何; Ⅱ 定量地确定它们之间的互依关系。 相关分析的类型: 线性相关;秩相关;分类变量的关联性分析。 相关分析的条件: 要求数据成对出现;两变量为连续性变量; 两变量正态分布。
线性相关分析的步骤 基本步骤: 1. 做散点图 2. 计算相关系数(Pearson积差相关系数) 相关系数的特点: -1≤r ≤1;r>0为正相关,r<0为负相关; 越接近1,说明相关性越好, 越接近于0,说明相关性越差。
线性相关分析的步骤 3. 相关系数的统计推断 建立假设 a. 直接查r临界值表,自由度为ν=n-2 b. 采用t检验
例 随机抽取15名健康成人,测定血液的凝血酶浓度(单位/毫升)及凝固时间,数据如下表。据此数据如何判断这两项指标间有否相关?
1. 计算相关系数 2. 假设检验 (1)建立假设检验 H0:ρ=0;H1:ρ≠0; 检验水准:α=0.05。 (2)计算统计量 (3)确定P值并做出推断结论 自由度ν=13,查t界值表得, P<0.001,故拒绝H0,差别有统计学意义。认为凝血酶 浓度与凝血时间之间存在负相关。
秩相关 对不服从正态分布的资料,或是总体分布 未知的资料,采用秩相关或等级相关来刻画两 个变量间相关的程度与方向。 这类方法是利用两变量的秩次大小作线性 相关分析,对原变量的分布不作要求。 常用Spearman秩相关
秩相关的分析步骤 秩相关中相关系数为Spearman秩相关系 数或等级相关系数,用rs表示 相关系数的统计推断 a. 直接查r临界值表,自由度为ν=n b. 采用t检验(同前)
例 某地研究2-7岁急性白血病患儿的血小板数与出血症 状程度之间的相关性,结果如下表,试进行秩相关分析。
分类变量的关联性分析 对定性变量之间的联系通用的方法是根据 两个定性变量交叉分类计数所得的频数资料 (列联表)作关联分析,即关于两种属性独立 性的χ2检验。 分类变量关联系分析的分类: 交叉分类2×2表的关联性分析; 2×2配对资料的关联性分析; R×C表分类资料的关联性分析。
交叉分类2×2表的关联性分析 假设检验步骤 1. 建立检验假设 H0:两种属性之间互相独立;H1:两种属性之间互相关联; 检验水准:α=0.05。 2. 采用拟合优度检验的χ2统计量 3. 根据(2)中结果,确定是否有关联,若存在关联,则 计算相关系数。 4. 对相关系数作统计推断。
交叉分类2×2表的关联性分析 交叉分类资料独立性检验与比较两独立样 本频率的假设检验所用的χ2检验公式、理论 频数计算公式和自由度的计算公式完全相同。 但是这两类问题的研究目的、设计方案、数据 结构以及最后对于结果的解释都是不同的。
例 为观察婴儿腹泻是否与喂养方式有关,某医院儿 科随机守纪律消化不良的婴儿82例,把该院儿科所有消 化不良的患儿视为一个总体的话,则该82例患儿可看做 是一份随机样本。对每个个体分别观察腹泻与否和喂养 方式两种属性,2×2结果分类计数如下表。试分析两种 属性的关联性。
2×2配对资料和R×C表分类资料的关联性分析 与交叉分类2×2表资料的关联性分析类似。 1. 先根据χ2统计量,检测行变量和列变量间是否有关联; 2. 若存在关联计算相关系数,并对相关系数作假设检验。
简单回归分析 用途: 通过可测或易测的变量对未知或难测或不可测变量 的状态进行估计。 反应变量(Y)依赖于另一自变量(X)的简单线性回归 模型为: 通常情况下,研究者只能获取一定数量的样本数据,用该样本数据建立的有关Y依X变化的线性表达式称为回归方程。即
参数α和β一般通过样本数据来估计,回归 参数估计方法为最小二乘法。 回归系数b和回归截距a计算公式:
总体回归系数β的假设检验(t检验) 1. 检验假设 H0: β=0 ;H1: β≠0; 2. 检验统计量为 3.确定P值表并做出推断结论 检验水准α=0.05 2. 检验统计量为 3.确定P值表并做出推断结论 4. 总体回归系数β的(1-α)置信区间为:
多重线性回归与相关 多重回归与多重相关是研究一个因变量和 多个自变量之间线性关系的统计学分析方法。 多重线性回归的数学模型: 由样本估计得多重线性回归方程:
Logistic回归分析 在医学研究中, 经常要分析某种结果的产生与哪些因 素有关。例如:生存与死亡, 发病与未发病, 阴性与阳性 等结果的产生可能与病人的年龄、性别、生活习惯、体 质、遗传等许多因素有关。如何找出其中哪些因素对结 果的产生有显著性影响。 Logistic回归分析正是解决这类问题的多元分析方法。 Logistic回归分析,是分析可能对疾病产生作用的一 些因素(自变量),对疾病(因变量)发生的影响。 Logistic回归属于概率型回归,因此,可用来分析某 类事件发生的概率与变量之间的联系。
Logistic回归的类型 条件Logistic回归与非条件Logistic回归,两者根本的差别在于:构造回归模型时,前者使用了条件概率。
非条件logistic回归模型的基本结构 假设某疾病发生率与影响因素的关系,表述如下: 设影响因素与P和(1-P)比值的对数成线性关系,即 由上式解出P,得到P直接与X的关系式: 在数学中,上式右端称为logistic函数,所以将上式称为logistic回归模型。
如果有p个自变量,可以将βX看做是p个自变 量的线性组合β0+β1X1+…+βpXp,于是,多变 量的logistic回归模型为:
Logistic回归函数的图像 以概率P(原始应变量)为纵轴,自变量 X 为横轴,可绘制出一条S形曲线。回归参数的正负符号与绝对值大小,分别决定了S形曲线的形状与方向。 β绝对值越大,P越靠近0或1。
回归模型和回归系数的假设检验 回归模型和系数假设检验的目的: 检验整个模型是否有统计学意义以及单个总体回归 常用假设检验统计量: 系数是否为零。 常用假设检验统计量: 1. 似然比检验: 常用于比较两个模型的拟合效果,模型1比模型2含自 变量少。 似然比检验统计量:G=﹣2㏑L﹣ (﹣2㏑L’) 反映模 型2较模型1拟合优度提高的程度。大样本时,在H0成立 下,G服从χ2分布,自由度为增加变量的个数。
2. Wald检验: 常用于回归系数的假设检验。 3. 优势比的区间估计 总体回归系数β的(1-α)置信区间为:
在研究医院抢救急性心肌梗塞(AMI)患者能否成功的危险因素调查中,某医院收集了5年中该院所有的AMI患者的抢救病史,共200例。其中P=0表示抢救成功,P=1表示抢救未成功;X1=1表示抢救前已发生休克, X1=0表示抢救前未发生休克; X2=1 表示抢救前有心衰 , X2=0表示抢救前无心衰; X3=1 表示抢救时超过24h, X3=0表示抢救时未超过24h。 分析影响抢救成功率的因素,为制定有针对性的措施提供依据,并建立预测抢救成率的模型。
表 参数估计与Wald检验结果 同时考虑三个变量X1、X2、X3的logistic回归分析结果,由此结果得到相应的logistic回归表达式为: 其中常数项, =﹣2.0858表示在其它自变量均为零时死亡优势的对数值; =0.1242是无休克、无心衰和抢救及时组死亡的优势。
logistic回归系数的意义 1. 当logistic回归系数为正值时: 大于1,说明该因素是危险因素; 小于1,该因素是保护因素; 3. 当logistic回归系数为零时: 等于1,该因素不起作用。 建立的logistic模型那个可用于预测。如:某AMI患者在有AMI症状后5h送到医院,并未发生休克但已有心衰症状,用上述模型计算出可能死亡率为0.2001,因此预测患者抢救成功的概率为1﹣0.2001=0.7999。
注意:在分析病例对照资料时,由于病例对照研究的病例与对照的比例是人为定的,不能代表自然人群中病例与非病例的比例,因此这里的常数项没有实际意义,该回归模型也不能直接用于预测。
条件logistic回归分析 配对设计的病例对照研究中:每一配对组内的病例与对照是可比的,而组间的病例与对照无可比性。因此需要按配比组内(每个配比组为一层)对象的暴露状况与发病情况建立logistic回归模型。
条件logistic模型的基本结构 设第i队中的病例为A,对照为B,Y=1表示得病,Y=0表示未得病。则一对病例和对照中,只有1人得病的条件下恰好是A得病概率为: 上式左端是“病例和对照两者之一得病的条件下病例得病的条件概率”,右端是一个logistic函数。将上式称为条件logistic回归模型。
回归系数β表示患病的机会与变量值的关系, 即表示变量增加一个单位时,患病的概率放大的倍数,即增与不增的相对危险度RR。β大于0表示该变量为危险因子,β小于0表示该变量是保护因子。 当有p个自变量时,条件logistic回归模型的表达式为:
例 某市调查调查食管癌发病与咸鱼摄入的关系,设计时采用1:1配对病例-对照形式,按每一个病例的性别、年龄和居住地选取一个健康对照。调查的咸鱼摄入量分三个水平:1表示“<1次/月”,2表示“>1次/月”,3表示“>1次/周”。共调查200对病例与对照,结果如下表。
表 参数估计与Wald检验结果 X表示咸鱼摄入频率,回归系数为1.058,优势比为2.881,表示咸鱼摄入率每增加一个等级,发病危险增大到2.881倍。 X1,X2表示咸鱼摄入频率的三个等级,目的是研究剂量反应关系。