類別資料分析(Categorical Data Analysis) 單元: 勝算比與相對風險 中華大學餐旅管理系羅琪老師
二元反應變數 在醫學領域裡常將因變數(dependent / response variable)定義為二元的變數(binary / dichotomous variable) 有些是天生的二元變數,例如:病人死亡與否、病人洗腎與否 有些則是人為定義的二元變項,例如:心臟科常將病人的左心室射血分數(LVEF)小於40% (or 35%) 為異常,或腎臟科將病人的腎絲球過濾率(eGFR)定義為小於60%為異常。 醫學期刊常見的風險測量(Risk measure in medical journal)~晨晰統計林星帆顧問整理
比較比例 在2×2列聯表 在第一列成功的機率為 𝛑 𝟏 在第二列成功的機率為 𝛑 𝟐 若 𝛑 𝟏 = 𝛑 𝟐 ,代表Y與組別獨立(無關) Y 失敗 Group 1 Group 2 在第一列成功的機率為 𝛑 𝟏 在第二列成功的機率為 𝛑 𝟐 若 𝛑 𝟏 = 𝛑 𝟐 ,代表Y與組別獨立(無關)
比較比例 在2×2列聯表 有興趣研究2組成功的比例的差異 𝛑 𝟏 − 𝛑 𝟐 𝛑 𝟏 − 𝛑 𝟐 的點估計值為 𝐩 𝟏 - 𝐩 𝟐 有興趣研究2組成功的比例的差異 𝛑 𝟏 − 𝛑 𝟐 𝛑 𝟏 − 𝛑 𝟐 的點估計值為 𝐩 𝟏 - 𝐩 𝟐 𝐩 𝟏 - 𝐩 𝟐 的標準誤為 𝛔 ( 𝐩 𝟏 - 𝐩 𝟐 )= 𝐩 𝟏 (𝟏− 𝐩 𝟏 ) 𝐧 𝟏 + 𝐩 𝟐 (𝟏− 𝐩 𝟐 ) 𝐧 𝟐 大樣本近似的100(1-α)% 的 𝛑 𝟏 − 𝛑 𝟐 信賴區間為 ( 𝐩 𝟏 - 𝐩 𝟐 )± 𝐳 𝛂 𝟐 𝛔 ( 𝐩 𝟏 - 𝐩 𝟐 )
比較比例範例 哈佛大學醫學院內科醫生健康研究小組研究是否定期服用阿斯匹靈可降低得心肌梗塞的比率 𝐧 𝟏 =11034, 𝐧 𝟐 =11037 大樣本 𝐩 𝟏 = 𝟏𝟖𝟗 𝟏𝟏𝟎𝟑𝟒 =0.0171 比例差異= 𝐩 𝟏 - 𝐩 𝟐 =0.0077 𝐩 𝟐 = 𝟏𝟎𝟒 𝟏𝟏𝟎𝟑𝟕 =0.0094 心肌梗塞(MI) 組別 Yes No Total 安慰劑 189 10845 11034 阿斯匹靈 104 10933 11037 服用安慰劑得心肌梗塞的比例比服用阿斯匹靈得心肌梗塞的比例高0.0077
比較比例範例 𝐩 𝟏 - 𝐩 𝟐 =0.0077 𝛔 ( 𝐩 𝟏 - 𝐩 𝟐 )= 𝟎.𝟎𝟏𝟕𝟏(𝟎.𝟗𝟖𝟐𝟗) 𝟏𝟏𝟎𝟑𝟒 + 𝟎.𝟎𝟎𝟗𝟒(𝟎.𝟗𝟗𝟎𝟔) 𝟏𝟏𝟎𝟑𝟕 =0.0015 𝛑 𝟏 - 𝛑 𝟐 的95%的信賴區間(C.I.)為 0.007± 𝐳 𝟎.𝟎𝟐𝟓 (0.0015)= 0.0077± 1.96×(0.0015) [0.005, 0.011] 有95%的信心,服用安慰劑得心肌梗塞的比例比服用Aspirin得心肌梗塞的比例高0.005到0.011之間 因為區間只包含正值,服用Aspirin似乎能降低得心肌梗塞的風險
相對風險(Relative Risk; RR) 除了2個的比例的差異很有用之外 2個的比例的比率也很有用 因為0.01與0.001的差距與0.41與0.401的差距都是0.009 但 𝟎.𝟎𝟏 𝟎.𝟎𝟎𝟏 =10 而 𝟎.𝟒𝟏 𝟎.𝟒𝟎𝟏 =1.02 兩者差很多
相對風險(Relative Risk; RR) 母體相對風險= 𝛑 𝟏 𝛑 𝟐 樣本相對風險= 𝐩 𝟏 𝐩 𝟐
相對風險範例 𝐧 𝟏 =11034, 𝐧 𝟐 =11037 大樣本 𝐩 𝟏 = 𝟏𝟖𝟗 𝟏𝟏𝟎𝟑𝟒 =0.0171 相對風險RR= 𝐩 𝟏 𝐩 𝟐 = 𝟎.𝟎𝟏𝟕𝟏 𝟎.𝟎𝟎𝟗𝟒 =1.82 𝐩 𝟐 = 𝟏𝟎𝟒 𝟏𝟏𝟎𝟑𝟕 =0.0094 心肌梗塞(MI) 組別 Yes No Total 安慰劑 189 10845 11034 阿斯匹靈 104 10933 11037 服用安慰劑得心肌梗塞的比例是服用阿斯匹靈得心肌梗塞的比例的1.82倍 服用安慰劑得心肌梗塞的比例比服用阿斯匹靈得心肌梗塞的比例高82%
相對風險範例 但 𝐩 𝟏 𝐩 𝟐 =1.82卻告訴我們服用placebo得心肌梗塞比例是服用aspirin的1.82倍 比例差異= 𝐩 𝟏 - 𝐩 𝟐 =0.0077很小,我們會以為服用aspirin與placebo得心肌梗塞比例差不多 但 𝐩 𝟏 𝐩 𝟐 =1.82卻告訴我們服用placebo得心肌梗塞比例是服用aspirin的1.82倍 所以比較 𝐩 𝟏 , 𝐩 𝟐 時,不能只考慮差距 𝐩 𝟏 - 𝐩 𝟐 ,也要考慮比率 𝐩 𝟏 𝐩 𝟐
相對風險的信賴區間 log( 𝛑 𝟏 𝛑 𝟐 )的大樣本的近似的100(1-α)%信賴區間為 [左, 右] 𝛑 𝟏 𝛑 𝟐 的大樣本的近似的100(1-α)%信賴區間為 [ 𝒆 左 , 𝒆 右 ]
相對風險的信賴區間範例 𝐧 𝟏 =11034, 𝐧 𝟐 =11037, 𝐩 𝟏 =0.0171, 𝐩 𝟐 =0.0094 𝐩 𝟏 𝐩 𝟐 =1.82, 𝒛 𝟎.𝟎𝟐𝟓 =1.96 log(1.82)±1.96 𝟏−𝟎.𝟎𝟏𝟕𝟏 𝟏𝟏𝟎𝟑𝟒×𝟎.𝟎𝟏𝟕𝟏 + 𝟏−𝟎.𝟎𝟎𝟗𝟒 𝟏𝟏𝟎𝟑𝟕×𝟎.𝟎𝟎𝟗𝟒 心肌梗塞(MI) 組別 Yes No Total 安慰劑 189 10845 11034 阿斯匹靈 104 10933 11037
相對風險的信賴區間範例 95% C.I. for log( 𝛑 𝟏 𝛑 𝟐 ) is [0.3607351, 0.8369379] 95% C.I. for 𝛑 𝟏 𝛑 𝟐 is [ 𝒆 𝟎.𝟑𝟔𝟎𝟕𝟑𝟓𝟏 , 𝒆 𝟎.𝟖𝟑𝟔𝟗𝟑𝟕𝟗 ]=[1.434383, 2.309285] 有95%的信心,服用placebo得心肌梗塞的比例是服用Aspirin得心肌梗塞的比例的1.43倍到2.31倍之間。
勝算比(Odds Ratio; OR) 在第一列成功的機率為 𝛑 𝟏 ,失敗的機率1- 𝛑 𝟏 Y 成功 失敗 row 1 𝛑 𝟏 𝟏− 𝛑 𝟏 row 2 𝛑 𝟐 𝟏− 𝛑 𝟐 Y 成功 失敗 row 1 𝛑 𝟏𝟏 𝛑 𝟏𝟐 row 2 𝛑 𝟐𝟏 𝛑 𝟐𝟐 在第一列成功的機率為 𝛑 𝟏 ,失敗的機率1- 𝛑 𝟏 在第二列成功的機率為 𝛑 𝟐 ,失敗的機率1- 𝛑 𝟐 在第一列成功的勝算為 𝐨𝐝𝐝𝐬 𝟏 = 𝛑 𝟏 𝟏− 𝛑 𝟏 = 𝛑 𝟏𝟏 𝛑 𝟏𝟐 若 𝛑 𝟏 =0.75, 𝐨𝐝𝐝 𝟏 = 𝟎.𝟕𝟓 0.𝟐𝟓 =3, 所以成功的勝算=3 表示成功的機率是失敗的機率的三倍
勝算比(Odds Ratio; OR) 在第一列成功的勝算為 𝐨𝐝𝐝𝐬 𝟏 = 𝛑 𝟏 𝟏− 𝛑 𝟏 = 𝛑 𝟏𝟏 𝛑 𝟏𝟐 在第一列成功的勝算為 𝐨𝐝𝐝𝐬 𝟏 = 𝛑 𝟏 𝟏− 𝛑 𝟏 = 𝛑 𝟏𝟏 𝛑 𝟏𝟐 在第二列成功的勝算為 𝐨𝐝𝐝𝐬 2 = 𝛑 2 𝟏− 𝛑 2 = 𝛑 2𝟏 𝛑 2𝟐 勝算比(odds ratio)或交叉相乘比(cross-product ratio) 𝛉= 𝐨𝐝𝐝𝐬 𝟏 𝐨𝐝𝐝𝐬 𝟐 = 𝛑 𝟏 /(𝟏− 𝛑 𝟏 ) 𝛑 𝟐 /(𝟏− 𝛑 𝟐 ) = 𝛑 𝟏𝟏 / 𝛑 𝟏𝟐 𝛑 𝟐𝟏 / 𝛑 𝟐𝟐 = 𝛑 𝟏𝟏 𝛑 𝟐𝟐 𝛑 𝟏𝟐 𝛑 𝟐𝟏 若𝛉=4, 勝算比=4 表示第一列成功的勝算是 第二列成功的勝算的4倍 Y 成功 失敗 row 1 𝛑 𝟏𝟏 𝛑 𝟏𝟐 row 2 𝛑 𝟐𝟏 𝛑 𝟐𝟐
勝算比(Odds Ratio; OR) 勝算比-實驗組中發生疾病的勝算或危險性是對照組中發生該疾病的勝算或危險性的比率 有病 沒病 (Disease) (No disease) 實驗組(Exposed) 𝛑 𝟏𝟏 𝛑 𝟏𝟐 對照組(Unexposed) 𝛑 𝟐𝟏 𝛑 𝟐𝟐 勝算比-實驗組中發生疾病的勝算或危險性是對照組中發生該疾病的勝算或危險性的比率 勝算比-暴露組罹患疾病的勝算或危險性是非曝露組罹患疾病的勝算或危險性的比率
勝算比(Odds Ratio; OR) 勝算比 意義 𝜽=1 𝛑 𝟏 = 𝛑 𝟐 1<𝛉<∞ 𝛑 𝟏 > 𝛑 𝟐 第一列成功的勝算等於第二列成功的勝算 無論有無暴露於假設因素中,發生不良結果的可能性是一樣的 X與Y獨立 1<𝛉<∞ 𝛑 𝟏 > 𝛑 𝟐 第一列成功的勝算大於第二列成功的勝算 暴露於假設因素中,導致不良結果的風險增加 例: 吸二手煙者的得肺癌的勝算較大 0<𝛉<1 𝛑 𝟏 < 𝛑 𝟐 第一列成功的勝算小於第二列成功的勝算 露於假設因素中的人比未暴露於假設因素的人更不可能發生不良結果 例: 定期乳房檢查有乳癌的勝算較小
勝算比(Odds Ratio; OR) 母體勝算比 𝛉= 𝐨𝐝𝐝𝐬 𝟏 𝐨𝐝𝐝𝐬 𝟐 = 𝛑 𝟏 /(𝟏− 𝛑 𝟏 ) 𝛑 𝟐 /(𝟏− 𝛑 𝟐 ) = 𝛑 𝟏𝟏 / 𝛑 𝟏𝟐 𝛑 𝟐𝟏 / 𝛑 𝟐𝟐 = 𝛑 𝟏𝟏 𝛑 𝟐𝟐 𝛑 𝟏𝟐 𝛑 𝟐𝟏 樣本勝算比 𝛉 = 𝐩 𝟏 / 𝟏− 𝐩 𝟏 𝐩 𝟐 / 𝟏− 𝐩 𝟐 = 𝐧 𝟏𝟏 / 𝐧 𝟏𝟐 𝐧 𝟐𝟏 / 𝐧 𝟐𝟐 = 𝐧 𝟏𝟏 𝐧 2𝟐 𝐧 𝟐𝟏 𝐧 𝟏𝟐
勝算比範例 𝜃 = 𝐧 𝟏𝟏 𝐧 2𝟐 𝐧 𝟐𝟏 𝐧 𝟏𝟐 = 𝟏𝟖𝟗×𝟏𝟎𝟗𝟑𝟑 𝟏𝟎𝟒×𝟏𝟎𝟖𝟒𝟓 = 1.832 服用安慰劑得心肌梗塞的勝算是服用阿斯匹靈得 心肌梗塞的勝算的1.832倍 服用安慰劑得心肌梗塞的勝算比服用阿斯匹靈得心肌梗塞的勝算高83.2% 心肌梗塞(MI) 組別 Yes No Total 安慰劑 𝐧 𝟏1 =189 𝐧 𝟏2 =10845 11034 阿斯匹靈 𝐧 21 =104 𝐧 22 =10933 11037
勝算比與相對風險的關係 勝算比 = 𝐩 𝟏 / 𝟏− 𝐩 𝟏 𝐩 𝟐 / 𝟏− 𝐩 𝟐 = 相對風險 × 𝟏− 𝐩 𝟐 𝟏− 𝐩 𝟏 勝算比 = 𝐩 𝟏 / 𝟏− 𝐩 𝟏 𝐩 𝟐 / 𝟏− 𝐩 𝟐 = 相對風險 × 𝟏− 𝐩 𝟐 𝟏− 𝐩 𝟏 當 𝐩 𝟏 ≈0 與 𝐩 𝟐 ≈0 時, 𝟏− 𝐩 𝟏 𝟏− 𝐩 𝟐 ≈1 勝算比≈相對風險
範例 𝐩 𝟏 = 𝟏𝟖𝟗 𝟏𝟏𝟎𝟑𝟒 =0.0171, 𝐩 𝟐 = 𝟏𝟎𝟒 𝟏𝟏𝟎𝟑𝟕 =0.0094 都接近0 相對風險= 𝐩 𝟏 𝐩 𝟐 = 𝟎.𝟎𝟏𝟕𝟏 𝟎.𝟎𝟎𝟗𝟒 =1.82 勝算比= 𝜃 = 𝐧 𝟏𝟏 𝐧 2𝟐 𝐧 𝟐𝟏 𝐧 𝟏𝟐 = 𝟏𝟖𝟗×𝟏𝟎𝟗𝟑𝟑 𝟏𝟎𝟒×𝟏𝟎𝟖𝟒𝟓 = 1.832 心肌梗塞(MI) 組別 Yes No Total 安慰劑 𝐧 𝟏1 =189 𝐧 𝟏2 =10845 11034 阿斯匹靈 𝐧 21 =104 𝐧 22 =10933 11037 勝算比≈相對風險
勝算比的信賴區間 勝算比 𝛉 = 𝐧 𝟏𝟏 𝐧 2𝟐 𝐧 𝟐𝟏 𝐧 𝟏𝟐 , log(勝算比)=log( 𝛉 ) Log( 𝛉 )的標準誤(ASE)為 ASE log 𝜃 = 1 𝑛 11 + 1 𝑛 12 + 1 𝑛 21 + 1 𝑛 22 log𝛉的大樣本的近似的100(1-α)%信賴區間為log 𝛉 ± 𝐳 𝛂 𝟐 ASE(log( 𝛉 )) [左, 右] 𝛉的大樣本的近似的100(1-α)%信賴區間為 [ 𝒆 左 , 𝒆 右 ]
勝算比的信賴區間 若有 nij=0時,公式修正為 勝算比 𝜽 = 𝒏 𝟏𝟏 +𝟎.𝟓 𝒏 𝟐𝟐 +𝟎.𝟓 𝒏 𝟏𝟐 +𝟎.𝟓 𝒏 𝟐𝟏 +𝟎.𝟓 , log(勝算比)=log( 𝛉 ) Log( 𝛉 )的標準誤(ASE)為 ASE log 𝜃 = 1 𝑛 11 +0.5 + 1 𝑛 12 +0.5 + 1 𝑛 21 +0.5 + 1 𝑛 22 +0.5 log𝛉的大樣本的近似的100(1-α)%信賴區間為log 𝛉 ± 𝐳 𝛂 𝟐 ASE(log( 𝛉 ))
勝算比信賴區間範例 𝜃 = 𝐧 𝟏𝟏 𝐧 2𝟐 𝐧 𝟐𝟏 𝐧 𝟏𝟐 = 𝟏𝟖𝟗×𝟏𝟎𝟗𝟑𝟑 𝟏𝟎𝟒×𝟏𝟎𝟖𝟒𝟓 = 1.832 log 𝜃 = ln1.832 =0.60 心肌梗塞(MI) 組別 Yes No Total 安慰劑 𝐧 𝟏1 =189 𝐧 𝟏2 =10845 11034 阿斯匹靈 𝐧 21 =104 𝐧 22 =10933 11037
勝算比信賴區間範例 ASE log 𝜃 = 1 189 + 1 10933 + 1 104 + 1 10845 = 0.123 95% C.I. for logθ is 0.605±1.96(0.123) [0.365,0.846] 95% C.I. for θ is [ 𝑒 0.365 , 𝑒 0.846 ]=[1.44,2.33] 有95%的信心,服用placebo得心肌梗塞的勝算是服用Aspirin得心肌梗塞的勝算的1.44倍到2.33倍之間。
勝算比的假設檢定 𝐇 𝟎 :𝛉=1( 𝐨𝐝𝐝𝐬 𝟏 = 𝐨𝐝𝐝𝐬 𝟐 )服用placebo得心肌梗塞的勝算與服用Aspirin得心肌梗塞的勝算相等 𝐇 𝟏 :𝛉≠1 ( 𝐨𝐝𝐝𝐬 𝟏 ≠ 𝐨𝐝𝐝𝐬 𝟐 ) 服用placebo得心肌梗塞的勝算與服用Aspirin得心肌梗塞的勝算不相等 因為區間[1.44,2.33]不包含 1 所以Reject 𝐇 𝟎 at 𝜶=0.05 結論: 服用placebo得心肌梗塞的勝算與服用Aspirin得心肌梗塞的勝算不相等
付出最多的人,也是收穫最多的人 ~共勉之~