Download presentation
Presentation is loading. Please wait.
Published by菊 施 Modified 8年之前
1
1
2
時間變數 存活時間 設限 Kaplan-Meier 估計、 Greenwood 公式、信賴帶、 Log-Rank 檢定、 Gehan-Wilcoxon 檢定、 Peto- Wilcoxon 檢定 Cox 比率風險模型、 風險比、風險因子、保護因 子、交互作用 2
3
下面是台灣和信醫院於 2014 年針對肺癌臨床治療成果的一 部分報告: “…1990-2009 年間首次在和信醫院確定診斷為肺癌者共 2,681 人,其中男性 1,541 人 (57.5 % ) ,女性 1,140 人 (42.5 % ) ,年齡中位數 63 歲 ( 全距 17-92 歲 ) 。期別分佈以 三及四期為多數,占 77% 。各期別五年及十年存活率如表 12-1 、圖 12-1 ;第一及第二期五年存活機會分別為 70% 及 44% 。晚期病人存活機會一般少於 10% ,因此早期診斷 與更有效的治療是將來研究的重點。 ….” 。比較美國流行 病監督之公佈 2001-2007 年男性、女性肺癌五年存活率 為 13.5% 、 18.0% ,和信醫院同時期五年存活率分別為 13.7% 、 18.1% 。 3
4
4
5
以上報告的關鍵字是 ” 存活率 ” 。 醫生除了經常預測 病人 1 年或 5 年等的存活率外,也經常預測病人存活 的中位數。 以圖 12-1 的存活曲線來看,第四期肺癌病人的存 活中位數約為 1 年,第二期肺癌病人的存活中位數 約為 4.5 年。 存活率也會隨著性別、年齡、治療方法、基因、吸 煙狀況、或個人健康等因素的差異而有不同。 本章的重點除了研究如何估計存活率外,也研究如 何分析是甚麼因素會影響存活率的大小? 5
6
醫學研究或臨床實驗上分析病人 “ 存活率 ” 的方法有 多種方式,例如,肺癌病人 5 年的存活率是研究目 標的話,則我們可以觀察病人是否在 5 年內過世, 並應用前節介紹的 logistics regression 方法分析 就可以了。 但是, logistics regression 的研究在病人 “ 失去追 蹤觀察 (loss to follow-up)” 的情形發生時無法處理。 你僅知道 5 年的存活率,不知道 2 或 3 年的存活率 ? 6
7
假如你想研究肺癌病人死亡的發生率 / 人 - 年 ( incidence rate per person- year ),則我們可 以設計一個 5 年的研究,觀察病人在每年內死亡的 個數,然後應用前節介紹的 Poisson regression 方法分析。 Poisson regression 的分析方法,基本上使用時的 假設條件較多;例如,方法使用的前提要求在每一 個研究的時間區間內死亡率是固定,"死亡人數" 滿足 Poisson 機率分配 ! 本章的存活資料分析中不須要做任何機率分配的假 設。 7
8
存活分析顧名思義是研究有關於存活時間的方法, 這裡 “ 時間 ” 的定義有特殊性。 例如,大腸癌病人由診斷到因病死亡的時間,因大腸癌死 亡的時間,由經放射性治療後到因大腸癌死亡的時間 … 等, 均有不相同的時間計算定義。計算 “ 診斷為大腸癌 ” 的時 間到 “ 因病死亡 ” 的時間,這之間的時間距離稱為存活時 間。 計算存活時間首先必須明確的定義時間的單位,研 究起始時間及研究終結時間;而每一個研究病人的 起始及終結時間可能很不相同也不必相同。 8
9
研究起始和終結時間之間的時間距離就是觀察時間 (time to event) 。 “ 觀察時間 ” 這個變數在 R-web 中 稱為時間變數。 我們的觀察時間是否就是我們要研究的存活時間 ? 答案是不必然。因為研究時間的限制,經常在無法 觀測到所有研究病人的存活時間前,研究就必須結 束,或者研究期間病人失聯無法持續追蹤觀察,等。 觀察到的時間有時會小於真正的存活時間。這種特 殊的存活資料的性質(不完整性),使得我們無法 應用前面章節的統計方法分析資料。 9
10
我們在本章要介紹的存活分析方法除了使用時間變 數的資料外也必須使用存活事件變數的資料。 事件變數是用來表示觀察時間是否為存活時間的指 標(又稱為設限指標)變數。 ◦ 若 “ 是 ” 的話,事件變數值定義為 “1” ,表示觀察時間 資料是完整的存活資料 ◦ 若 “ 不是 ” 的話,則定義為 “0 ” ,表示觀察到的時間 資料是不完整的設限資料 ◦ 通常事件變數值為 “1” 時,又稱為一個事件, “0” 時 稱為設限( censored ) 10
11
例如,於大腸癌症病人的研究中,某病人於 2001 年 2 月初進入大腸癌症研究。於 2006 年 7 月初研究 結束時此病人仍然存活,則此人的時間變數值即為 65 個月,事件變數值為 0 ( censored )。 若此人不幸於 2003 年 7 月初死亡,則此人的時間變 數值為 29 個月,事件變數值為 1 。 以上所稱 “ 事件 ” 的研究不必然是有關死亡存活事件 的研究,例:癌症第一期惡化到第二期的發生也可 以稱事件。 此研究方法也可應用於很多領域,例如,應用於公 司破產的研究,將破產定義為研究的事件。 11
12
以下資料是第一章中所談的有關肺癌研究的資料。其 中所列的"存活狀態"變數就是事件變數。 12 位置性別年齡化療放療 存活狀態 (vital status) 首次 惡化 惡化 時間 吸煙情形 病理分期 存活時間 (月) N_stageT_stage DFCIFemale55No AliveNoNA Smoked in the past N0T2 or T3110 DFCIFemale41No AliveYes2 Smoked in the past N0T2 or T398 DFCIMale47YesNoAliveNoNA Smoked in the past N0T2 or T3110 DFCIMale73NA AliveNA Never smokedN0T2 or T366 DFCIFemale63NA DeadYes17 Currently smoking N1T2 or T329 DFCIMale72NA DeadYes5Never smokedN0T2 or T37 DFCIFemale57NA AliveNA Currently smoking N0T153 DFCIFemale55NA AliveNA N0T163 DFCIMale64NA AliveNA Smoked in the past N0T2 or T323
13
存活分析的研究中最重要的分析方法之一就是 Kaplan-Meier 估計法,又稱為 ”product-limit” 估 計法,是用來估計存活曲線的方法。 假設肺癌病人的存活時間以 T 表示,則我們經常以 S(t) =Pr(T > t) 表示病人 t 年的存活 ( 機 ) 率;例如, S(5) 是 5 年的存活率,代表病人能存活至少 5 年的機 率。 若將"不完整"的設限資料丟棄僅用完整的觀察到 的存活資料分析。這種作法可以嗎?答案是不適當 的;這樣的分析處理經常會造成存活率低估的現象, 以至於產生分析結論的偏差。 13
14
我們的臨床實驗研究在結束前有 n 個滿足研究條件 的個體"陸續"進入,參加存活研究的實驗。其中 最重要的有二種資料,一是時間變數的資料,二是 事件變數的資料。 觀察時間的資料可能是設限資料,或是存活資料; 資料可能以天為單位或以月為單位。 假設資料中有 m ( < n )個不相同的存活(非設限) 資料由小排到大,記錄為 , Kaplan-Meier 估計存活曲線 S(t) 的方法如下 : 14
15
15
16
16
17
17
18
若是肺癌病人存活的研究結果顯示,資料中觀察到 的最大存活時間是 4 年 8 個月,則問 5 年存活率為多 少?是沒有意義的。解決的辦法就是將研究時間延 長,直到觀察到的最大存活時間超過 5 年。 R-web 以下是在肺癌病人存活研究的資料檔( lung_cancer_study )上 傳到 www.r-web.com.tw 後,以點選方式選用路徑 : " 分析方 法 存活分析 Kaplan-Meier 存活函數估計 步驟一 (資料 匯入) : 使用個人資料檔 步驟二(參數設定):選擇變數:時 間變數: SURVIVAL_MONTHS ;事件變數: vital status 進階 選項 : 選擇分組變數 : gender ;選擇繪製圖型 : 存活函數圖 開始 分析"後所繪出的存活曲線圖;單位是月,男性表示 gender=1 , 女性表示 gender=0 。 www.r-web.com.tw 18
19
19 圖 12-2. 男性和女性肺癌病人的存活曲線
20
20
21
通常在臨床實驗研究中,研究人員會在不同的條件 下計算 Kaplan-Meier 存活曲線的估計,然後問一 個重要的問題:這些存活曲線是否相同? 例如,在肺癌病人的研究中,我們會問接受化療的 肺癌病人和接受放療的肺癌病人他們的存活時間是 否不相同?或男性和女性肺癌病人的存活時間是否 不相同? 假如男女性的存活時間是相同的話,則我們可以說 性別不是影響肺癌病人存活時間的因子。 21
22
首先我們必須先說明圖 12-2 中的存活曲線都是" 估計"的曲線,不是真實的曲線;估計的曲線和真 實的曲線之間存有因樣本而產生的誤差。 以下我們討論圖 12-2 中存活曲線的差異在統計上 來說有沒有意義?差異是否在統計上顯著? R-web 首先將肺癌病人存活研究的資料檔上傳到 www.r-web.com.tw 後,以點選方式選用路徑:" 分析方法 存活分析 存活函數 比較 步驟一(資料匯入) : 使用個人資料檔 步驟二(參數設 定):選擇變數:時間變數: SURVIVAL_ MONTHS ;事件變 數: Vital Status ;分組變數: GENDER 進階選項:比較方 法 :Log-Rank 檢定, Wilcoxon 檢定, Peto-Wilcoxon 檢定;選 擇繪製圖型:存活函數圖 開始分析",得下列分析結果 : www.r-web.com.tw 22
23
虛無假設:各存活函數間無顯著差異 檢定方法 method 檢定統計量 statistics 自由度 d.f. p- 值 p-value Log-Rank 檢 定 0.525610.4685 Gehan- Wilcoxon 檢定 1.190210.2753 Peto- Wilcoxon 檢定 1.190210.2753 23 表 12-2. 存活函數比較 若是比較 k 條存活曲線是否相同時,我們則改用自由度為 k- 1 的 “ 卡方 ” 計算 P 值。三種檢定分析的結果是一致的,結論 是:男性和女性肺癌病人存活時間的差異在統計上來說是 不顯著的。 我們這裡使用的三種重要的統計檢定方法都是 Wilcoxon 檢 定方法在有設限資料情況下發展出來的新方法,因此可以 說都是無母數方法。
24
Log-Rank 檢定法是存活分析中最常被引用的方法; 當二條 log- 存活函數的比值是常數時(又稱為" proportional hazards ", 比率風險,風險的比 值和時間無關), Log-Rank 的檢定力最高。 Gehan-Wilcoxon 檢定法和 Peto-Wilcoxon 檢定法 的結果較相似,當二條存活函數的表現有差異,但 差異僅發生在早期時,則這二種檢定方法的檢定力 較高,因此使用時也比較容易取得"有顯著差異" 的結論。 24
25
存活分析的方法中,最重要的是研究存活時間的影 響因子;性別會影響肺癌病人存活時間的長短?治 療方法(化療或放療)會影響肺癌病人存活時間的 長短?假如答案都是"會"的話,下一步要問的題 目是如何影響 ? 這節中,我們介紹 Cox 迴歸方法來解決這些問題。 Cox 迴歸模型又稱為 Cox 比率風險模型,或 Proportional Hazards 模型。 Cox 迴歸的分析中使用了一個重要的觀念叫做"風 險比( hazard ratio ,簡寫為 HR )"。 25
26
26
27
27
28
28
29
29
30
30
31
31
32
仍然使用肺癌病人存活研究資料,以點選方式選用路徑 : “ 分析方法 存活分析 Cox 比率風險模型 步驟一(資料 匯入) : 使用個人資料檔 步驟二(參數設定):選擇變 數:時間變數: SURVIVAL_MONTHS ;事件變數: Vital Status ;共變數: GENDER , AGE , CHEMO , RT , SMOKING , 進階選項 : 選擇信賴區間計算方法: log-log 轉換, 繪製存活函數圖(共變數值 = 平均數) 依給定變數分組繪圖(須為類別變數): RT 開始分析 ” , 得下列 Cox 迴歸分析結果。 32
33
R-web 之分析結果 33 變數名稱 variable 係數估計值 coef. esti. 標準差 std. err. z 檢定 統計量 z statistic p 值 p-value 估計值的指數 (風險比例) Exp ( coef. ) ( Hazard Ratio ) Exp ( coef. )的 95% 信賴區間 下界 lower 上界 upper AGE 0.02290.00564.0589< 1e-041.02311.01191.0345 GENDER (Male) 0.20960.1181.77580.07581.23320.97851.5541 CHEMO (Yes) -0.01390.1589-0.08740.93030.98620.72231.3465 RT (Yes) 0.39030.17252.26250.02371.47741.05362.0718 SMOKING (Never smoked) -0.57020.2522-2.26110.02380.56540.34490.9269 SMOKING (Smoked in the past) -0.57660.2028-2.84270.00450.56180.37750.8361 分析中的共變因子取 GENDER 、 AGE 、 CHEMO 、 RT 、 SMOKING ,其中 CHEMO 表示化療, RT 表示放療。表 12-3 的 Cox 迴歸分析中的基線條件是 GENDER=Female , AGE= 平均年齡, CHEMO= 無, RT= 無, SMOKING= 有, 結果顯示:除了 CHEMO 及 GENDER 因子統計上不顯著外,其餘因子都顯著。
34
係數估計值顯示 RT ( yes )及 AGE 是風險因素外,其 餘顯著的因子都是保護的因子。 圖 12-4 的結果則顯示 : 在共變因子調整( covariate- adjusted )後非接受放療病人的存活率是比接受放療病 人的存活率高。 共變因子調整後接受(或非接受)放療病人的存活曲線 是指在 Cox 比率風險模型下計算的存活曲線,表示是在 調整 RT 以外的共變因子於平均值(或中位數或其他有 代表性的數值)的水準情況下,所計算出來的存活曲線。 給定任何要調整的共變因水準, R-web 都可以提供存活 曲線的計算,使用者可選擇使用。 34
35
35
36
36
37
The End 35
Similar presentations