1.  時間變數  存活時間  設限  Kaplan-Meier 估計、 Greenwood 公式、信賴帶、 Log-Rank 檢定、 Gehan-Wilcoxon 檢定、 Peto- Wilcoxon 檢定  Cox 比率風險模型、 風險比、風險因子、保護因 子、交互作用 2.

Slides:



Advertisements
Similar presentations
Chap 3 微分的應用. 第三章 3.1 區間上的極值 3.2 Rolle 定理和均值定理 3.3 函數的遞增遞減以及一階導數的判定 3.4 凹面性和二階導數判定 3.5 無限遠處的極限 3.6 曲線繪圖概要 3.7 最佳化的問題 3.8 牛頓法 3.9 微分.
Advertisements

工職數學 第四冊 第一章 導 數 1 - 1 函數的極限與連續 1 - 2 導數及其基本性質 1 - 3 微分公式 1 - 4 高階導函數.
©2009 陳欣得 統計學 —e1 微積分基本概念 1 第 e 章 微積分基本概念 e.1 基本函數的性質 02 e.2 微分基本公式 08 e.3 積分基本公式 18 e.4 多重微分與多重積分 25 e.5 微積分在統計上的應用 32.
不定積分 不定積分的概念 不定積分的定義 16 不定積分的概念 16.1 不定積分的概念 以下是一些常用的積分公式。
大綱 1. 三角函數的導函數. 2. 反三角函數的導函數. 3. 對數函數的導函數. 4. 指數函數的導函數.
變數與函數 大綱 : 對應關係 函數 函數值 顧震宇 台灣數位學習科技股份有限公司. 對應關係 蛋餅飯糰土司漢堡咖啡奶茶 25 元 30 元 25 元 35 元 25 元 20 元 顧震宇 老師 台灣數位學習科技股份有限公司 變數與函數 下表是早餐店價格表的一部分: 蛋餅 飯糰 土司 漢堡 咖啡 奶茶.
1.  干擾變數  連結函數  粗糙的勝算比  調整後的勝算比  交互作用  分層分析 2.
單元九:單因子變異數分析.
台灣歷年女性生殖系統癌症 發生率的變化.
應用統計理論 編著:劉正夫教授 Reference:1) Wonnacott and Wonnacott. Introductory
應用統計學 授課大綱 – 暑期班 By: Dr. Tsung-Nan Tsai.
陶板屋 組員:陳婷 劉峻愷 趙崇佑 陳鵬如.
医学统计学 8 主讲人 陶育纯 医学统计学 8 主讲人 陶育纯
數 據 分 析 林煜家 魏韶寬 陳思羽 邱振源.
2015/Spring 跨平台行動程式進階應用 王派洲老師
17 類別資料的分析  學習目的.
物價膨脹與通貨緊縮 物價膨脹.
第四章 數列與級數 4-1 等差數列與級數 4-2 等比數列與級數 4-3 無窮等比級數 下一頁 總目錄.
5.1 自然對數函數:微分 5.2 自然對數函數:積分 5.3 反函數 5.4 指數函數:微分與積分 5.5 一般底數的指數函數和應用 5.6 反三角函數:微分 5.7 反三角函數:積分 5.8 雙曲函數.
國際金融專題 亞太國家的股價和匯率之間的共整合關係 林秉毅 授課教師 :楊奕農老師.
迴歸分析 主講人:童超塵 實驗室網址 永久: 實驗室網址 永久: 目前:
第五章 標準分數與常態分配 第一節 相對地位量數 第二節 常態分配 第三節 偏態與峰度 第四節 常態化標準分數 第五節 電腦習作.
Chap3 Descriptive statistics -numerical measures Minitab & Excel
實驗計畫資料分析作業解答 何正斌 國立屏東科技大學工業管理系.
第四章 資金成本.
Regression for binary outcomes
Using EXCEL for ANOVA.
4B冊 認識公倍數和最小公倍數 公倍數和最小公倍數的關係.
課程九 迴歸與相關2.
邏輯迴歸 Logistic Regression
在NS-2上模擬多個FTP連線,觀察頻寬的變化
SQL Stored Procedure SQL 預存程序.
MEDLINE with full text (EBSCO)
熱力實驗
尋找EBM心得分享 資料整理: 報告者:.
Java 程式設計 講師:FrankLin.
越南現況資料.
第十一章 相關研究法.
指導老師: 蘇明俊 老師 組長:潘翠娥 組員:張惠雅 葉麗華
大數據與我 4A 陳駿榜.
第二次電腦實習課 說明者:吳東陽 2003/10/07.
香港快樂指數 2007 何濼生教授 嶺南大學公共政策研究中心.
第十四章 單因子變異數分析 14.1 前言 14.2 單因子變異數分析理論 14.3 功能視窗 14.4 範例
第一章 直角坐標系 1-3 函數圖形.
學習單元:N6 數的性質 學習單位:N6-3 用短除法求H.C.F. 和 L.C.M. 學習重點 : 1. 複習因數分解法求
網頁資料知多少? 事 實 ? 謠言?.
國立台灣體育學院 體育學系暨體育研究所 高明峰
Definition of Trace Function
有關於股票報酬及匯率變化對台灣醫療產業市場收益的分析
小學四年級數學科 8.最大公因數.
第五章 估計與信賴區間 5.1 估計概論 估計量的分配 信賴度、信賴區間與最大容忍誤差16
機會成本知多少 機會成本的定義 1.
Ogive plot example 說明者:吳東陽 2003/10/10.
HelloPurr_Extend 靜宜大學資管系 楊子青
電子期刊使用統計 CONCERT 2002 meeting November 13-14, 2002 羅宙康 Springer-Verlag
小學數學科 方塊圖 製作 — 麥頌儀老師 (青山天主教小學上午校).
MiRanda Java Interface v1.0的使用方法
楊志強 博士 國立台北教育大學系 教育統計學 楊志強 博士 國立台北教育大學系
第十一單元 兩曲線圍出的面積.
第十四章名義資料的數字 描述:關連測量 © Copyright 版權所有:學富文化事業有限公司。本光碟內容僅提供教師於教學上使用,非經本公司許可,禁止複製 (給學生)。感謝老師的配合。
歸納法(1):歸納法的類別.
第一章 直角坐標系 1-3 函數及其圖形.
4-1 變數與函數 第4章 一次函數及其圖形.
Speaker: 泌尿科R1陳柏仲 Advisor: 一般外VS郭威廷
單元三:敘述統計 內容: * 統計量的計算 * 直方圖的繪製.
ABAP Basic Concept (2) 運算子 控制式與迴圈 Subroutines Event Block
17.1 相關係數 判定係數:迴歸平方和除以總平方和 相關係數 判定係數:迴歸平方和除以總平方和.
熱力實驗
第三章 比與比例式 3-1 比例式 3-2 連比例 3-3 正比與反比.
ABAP Basic Concept (2) 運算子 控制式與迴圈 Subroutines Event Block
Presentation transcript:

1

 時間變數  存活時間  設限  Kaplan-Meier 估計、 Greenwood 公式、信賴帶、 Log-Rank 檢定、 Gehan-Wilcoxon 檢定、 Peto- Wilcoxon 檢定  Cox 比率風險模型、 風險比、風險因子、保護因 子、交互作用 2

下面是台灣和信醫院於 2014 年針對肺癌臨床治療成果的一 部分報告: “… 年間首次在和信醫院確定診斷為肺癌者共 2,681 人,其中男性 1,541 人 (57.5 % ) ,女性 1,140 人 (42.5 % ) ,年齡中位數 63 歲 ( 全距 歲 ) 。期別分佈以 三及四期為多數,占 77% 。各期別五年及十年存活率如表 12-1 、圖 12-1 ;第一及第二期五年存活機會分別為 70% 及 44% 。晚期病人存活機會一般少於 10% ,因此早期診斷 與更有效的治療是將來研究的重點。 ….” 。比較美國流行 病監督之公佈 年男性、女性肺癌五年存活率 為 13.5% 、 18.0% ,和信醫院同時期五年存活率分別為 13.7% 、 18.1% 。 3

4

 以上報告的關鍵字是 ” 存活率 ” 。 醫生除了經常預測 病人 1 年或 5 年等的存活率外,也經常預測病人存活 的中位數。  以圖 12-1 的存活曲線來看,第四期肺癌病人的存 活中位數約為 1 年,第二期肺癌病人的存活中位數 約為 4.5 年。  存活率也會隨著性別、年齡、治療方法、基因、吸 煙狀況、或個人健康等因素的差異而有不同。  本章的重點除了研究如何估計存活率外,也研究如 何分析是甚麼因素會影響存活率的大小? 5

 醫學研究或臨床實驗上分析病人 “ 存活率 ” 的方法有 多種方式,例如,肺癌病人 5 年的存活率是研究目 標的話,則我們可以觀察病人是否在 5 年內過世, 並應用前節介紹的 logistics regression 方法分析 就可以了。  但是, logistics regression 的研究在病人 “ 失去追 蹤觀察 (loss to follow-up)” 的情形發生時無法處理。  你僅知道 5 年的存活率,不知道 2 或 3 年的存活率 ? 6

 假如你想研究肺癌病人死亡的發生率 / 人 - 年 ( incidence rate per person- year ),則我們可 以設計一個 5 年的研究,觀察病人在每年內死亡的 個數,然後應用前節介紹的 Poisson regression 方法分析。  Poisson regression 的分析方法,基本上使用時的 假設條件較多;例如,方法使用的前提要求在每一 個研究的時間區間內死亡率是固定,"死亡人數" 滿足 Poisson 機率分配 !  本章的存活資料分析中不須要做任何機率分配的假 設。 7

 存活分析顧名思義是研究有關於存活時間的方法, 這裡 “ 時間 ” 的定義有特殊性。 例如,大腸癌病人由診斷到因病死亡的時間,因大腸癌死 亡的時間,由經放射性治療後到因大腸癌死亡的時間 … 等, 均有不相同的時間計算定義。計算 “ 診斷為大腸癌 ” 的時 間到 “ 因病死亡 ” 的時間,這之間的時間距離稱為存活時 間。  計算存活時間首先必須明確的定義時間的單位,研 究起始時間及研究終結時間;而每一個研究病人的 起始及終結時間可能很不相同也不必相同。 8

 研究起始和終結時間之間的時間距離就是觀察時間 (time to event) 。 “ 觀察時間 ” 這個變數在 R-web 中 稱為時間變數。  我們的觀察時間是否就是我們要研究的存活時間 ? 答案是不必然。因為研究時間的限制,經常在無法 觀測到所有研究病人的存活時間前,研究就必須結 束,或者研究期間病人失聯無法持續追蹤觀察,等。  觀察到的時間有時會小於真正的存活時間。這種特 殊的存活資料的性質(不完整性),使得我們無法 應用前面章節的統計方法分析資料。 9

 我們在本章要介紹的存活分析方法除了使用時間變 數的資料外也必須使用存活事件變數的資料。  事件變數是用來表示觀察時間是否為存活時間的指 標(又稱為設限指標)變數。 ◦ 若 “ 是 ” 的話,事件變數值定義為 “1” ,表示觀察時間 資料是完整的存活資料 ◦ 若 “ 不是 ” 的話,則定義為 “0 ” ,表示觀察到的時間 資料是不完整的設限資料 ◦ 通常事件變數值為 “1” 時,又稱為一個事件, “0” 時 稱為設限( censored ) 10

 例如,於大腸癌症病人的研究中,某病人於 2001 年 2 月初進入大腸癌症研究。於 2006 年 7 月初研究 結束時此病人仍然存活,則此人的時間變數值即為 65 個月,事件變數值為 0 ( censored )。  若此人不幸於 2003 年 7 月初死亡,則此人的時間變 數值為 29 個月,事件變數值為 1 。  以上所稱 “ 事件 ” 的研究不必然是有關死亡存活事件 的研究,例:癌症第一期惡化到第二期的發生也可 以稱事件。  此研究方法也可應用於很多領域,例如,應用於公 司破產的研究,將破產定義為研究的事件。 11

以下資料是第一章中所談的有關肺癌研究的資料。其 中所列的"存活狀態"變數就是事件變數。 12 位置性別年齡化療放療 存活狀態 (vital status) 首次 惡化 惡化 時間 吸煙情形 病理分期 存活時間 (月) N_stageT_stage DFCIFemale55No AliveNoNA Smoked in the past N0T2 or T3110 DFCIFemale41No AliveYes2 Smoked in the past N0T2 or T398 DFCIMale47YesNoAliveNoNA Smoked in the past N0T2 or T3110 DFCIMale73NA AliveNA Never smokedN0T2 or T366 DFCIFemale63NA DeadYes17 Currently smoking N1T2 or T329 DFCIMale72NA DeadYes5Never smokedN0T2 or T37 DFCIFemale57NA AliveNA Currently smoking N0T153 DFCIFemale55NA AliveNA N0T163 DFCIMale64NA AliveNA Smoked in the past N0T2 or T323

 存活分析的研究中最重要的分析方法之一就是 Kaplan-Meier 估計法,又稱為 ”product-limit” 估 計法,是用來估計存活曲線的方法。  假設肺癌病人的存活時間以 T 表示,則我們經常以 S(t) =Pr(T > t) 表示病人 t 年的存活 ( 機 ) 率;例如, S(5) 是 5 年的存活率,代表病人能存活至少 5 年的機 率。  若將"不完整"的設限資料丟棄僅用完整的觀察到 的存活資料分析。這種作法可以嗎?答案是不適當 的;這樣的分析處理經常會造成存活率低估的現象, 以至於產生分析結論的偏差。 13

 我們的臨床實驗研究在結束前有 n 個滿足研究條件 的個體"陸續"進入,參加存活研究的實驗。其中 最重要的有二種資料,一是時間變數的資料,二是 事件變數的資料。  觀察時間的資料可能是設限資料,或是存活資料; 資料可能以天為單位或以月為單位。  假設資料中有 m ( < n )個不相同的存活(非設限) 資料由小排到大,記錄為 , Kaplan-Meier 估計存活曲線 S(t) 的方法如下 : 14

15

16

17

 若是肺癌病人存活的研究結果顯示,資料中觀察到 的最大存活時間是 4 年 8 個月,則問 5 年存活率為多 少?是沒有意義的。解決的辦法就是將研究時間延 長,直到觀察到的最大存活時間超過 5 年。  R-web 以下是在肺癌病人存活研究的資料檔( lung_cancer_study )上 傳到 後,以點選方式選用路徑 : "  分析方 法  存活分析  Kaplan-Meier 存活函數估計  步驟一 (資料 匯入) : 使用個人資料檔  步驟二(參數設定):選擇變數:時 間變數: SURVIVAL_MONTHS ;事件變數: vital status  進階 選項 : 選擇分組變數 : gender ;選擇繪製圖型 : 存活函數圖  開始 分析"後所繪出的存活曲線圖;單位是月,男性表示 gender=1 , 女性表示 gender=0 。 18

19 圖 男性和女性肺癌病人的存活曲線

20

 通常在臨床實驗研究中,研究人員會在不同的條件 下計算 Kaplan-Meier 存活曲線的估計,然後問一 個重要的問題:這些存活曲線是否相同?  例如,在肺癌病人的研究中,我們會問接受化療的 肺癌病人和接受放療的肺癌病人他們的存活時間是 否不相同?或男性和女性肺癌病人的存活時間是否 不相同?  假如男女性的存活時間是相同的話,則我們可以說 性別不是影響肺癌病人存活時間的因子。 21

 首先我們必須先說明圖 12-2 中的存活曲線都是" 估計"的曲線,不是真實的曲線;估計的曲線和真 實的曲線之間存有因樣本而產生的誤差。  以下我們討論圖 12-2 中存活曲線的差異在統計上 來說有沒有意義?差異是否在統計上顯著?  R-web 首先將肺癌病人存活研究的資料檔上傳到 後,以點選方式選用路徑:"  分析方法  存活分析  存活函數 比較  步驟一(資料匯入) : 使用個人資料檔  步驟二(參數設 定):選擇變數:時間變數: SURVIVAL_ MONTHS ;事件變 數: Vital Status ;分組變數: GENDER  進階選項:比較方 法 :Log-Rank 檢定, Wilcoxon 檢定, Peto-Wilcoxon 檢定;選 擇繪製圖型:存活函數圖  開始分析",得下列分析結果 : 22

虛無假設:各存活函數間無顯著差異 檢定方法 method 檢定統計量 statistics 自由度 d.f. p- 值 p-value Log-Rank 檢 定 Gehan- Wilcoxon 檢定 Peto- Wilcoxon 檢定 表 存活函數比較  若是比較 k 條存活曲線是否相同時,我們則改用自由度為 k- 1 的 “ 卡方 ” 計算 P 值。三種檢定分析的結果是一致的,結論 是:男性和女性肺癌病人存活時間的差異在統計上來說是 不顯著的。  我們這裡使用的三種重要的統計檢定方法都是 Wilcoxon 檢 定方法在有設限資料情況下發展出來的新方法,因此可以 說都是無母數方法。

 Log-Rank 檢定法是存活分析中最常被引用的方法; 當二條 log- 存活函數的比值是常數時(又稱為" proportional hazards ", 比率風險,風險的比 值和時間無關), Log-Rank 的檢定力最高。  Gehan-Wilcoxon 檢定法和 Peto-Wilcoxon 檢定法 的結果較相似,當二條存活函數的表現有差異,但 差異僅發生在早期時,則這二種檢定方法的檢定力 較高,因此使用時也比較容易取得"有顯著差異" 的結論。 24

 存活分析的方法中,最重要的是研究存活時間的影 響因子;性別會影響肺癌病人存活時間的長短?治 療方法(化療或放療)會影響肺癌病人存活時間的 長短?假如答案都是"會"的話,下一步要問的題 目是如何影響 ?  這節中,我們介紹 Cox 迴歸方法來解決這些問題。 Cox 迴歸模型又稱為 Cox 比率風險模型,或 Proportional Hazards 模型。  Cox 迴歸的分析中使用了一個重要的觀念叫做"風 險比( hazard ratio ,簡寫為 HR )"。 25

26

27

28

29

30

31

 仍然使用肺癌病人存活研究資料,以點選方式選用路徑 : “ 分析方法 存活分析 Cox 比率風險模型 步驟一(資料 匯入) : 使用個人資料檔 步驟二(參數設定):選擇變 數:時間變數: SURVIVAL_MONTHS ;事件變數: Vital Status ;共變數: GENDER , AGE , CHEMO , RT , SMOKING , 進階選項 : 選擇信賴區間計算方法: log-log 轉換, 繪製存活函數圖(共變數值 = 平均數) 依給定變數分組繪圖(須為類別變數): RT 開始分析 ” , 得下列 Cox 迴歸分析結果。 32

 R-web 之分析結果 33 變數名稱 variable 係數估計值 coef. esti. 標準差 std. err. z 檢定 統計量 z statistic p 值 p-value 估計值的指數 (風險比例) Exp ( coef. ) ( Hazard Ratio ) Exp ( coef. )的 95% 信賴區間 下界 lower 上界 upper AGE < 1e GENDER (Male) CHEMO (Yes) RT (Yes) SMOKING (Never smoked) SMOKING (Smoked in the past) 分析中的共變因子取 GENDER 、 AGE 、 CHEMO 、 RT 、 SMOKING ,其中 CHEMO 表示化療, RT 表示放療。表 12-3 的 Cox 迴歸分析中的基線條件是 GENDER=Female , AGE= 平均年齡, CHEMO= 無, RT= 無, SMOKING= 有, 結果顯示:除了 CHEMO 及 GENDER 因子統計上不顯著外,其餘因子都顯著。

 係數估計值顯示 RT ( yes )及 AGE 是風險因素外,其 餘顯著的因子都是保護的因子。  圖 12-4 的結果則顯示 : 在共變因子調整( covariate- adjusted )後非接受放療病人的存活率是比接受放療病 人的存活率高。  共變因子調整後接受(或非接受)放療病人的存活曲線 是指在 Cox 比率風險模型下計算的存活曲線,表示是在 調整 RT 以外的共變因子於平均值(或中位數或其他有 代表性的數值)的水準情況下,所計算出來的存活曲線。  給定任何要調整的共變因水準, R-web 都可以提供存活 曲線的計算,使用者可選擇使用。 34

35

36

The End 35