匯東華統計顧問有限公司

"匯東華-認真作好每件事"
~統計，不再是阻力，而是助力~

BMJ小小統計問題(17)：How to read a Kaplan-Meier survival plot (如何看Kaplan-Meier 存活曲線圖)

前言：

針對存活分析相關概念進行介紹與說明。上週針對K-M survival curve的中位存活時間進行說明，學會如何看圖以及其意涵。本周則詳細介紹Kaplan-Meier plot如何閱讀，可以說是幾篇的總結，下周會介紹常看到的log rank test，之後彙整這幾周存活分析概念設計測驗題，有興趣的朋友到時可以試試。看了本文才知道原來小蟲子是可以用來治療壞死傷口的，真是長見識了。

匯東華課程介紹

問題：

研究人員調查了蛆療法(larval therapy，或稱幼蟲療法)治療小腿潰瘍的有效性。採用三組隨機對照試驗設計。介入措施包括鬆散蛆(loose larvae)和袋裝蛆(bagged larvae)。對照組採用標準的親水凝膠清創術。參與者至少有一個靜脈或混合靜脈和動脈的潰瘍，至少有25%的蛻皮或壞死組織覆蓋。結果測量包括最大適合的潰瘍癒合時間和潰瘍癒合後清創時間(定義為美容性清潔傷口)。最長追蹤時間為12個月[1]。

總共招募了267名參與者，並隨機分為鬆散蛆(n=94)、袋裝蛆(n=86)或親水凝膠(n=87)三組。鬆散蛆與袋裝蛆組的癒合率無明顯差異，因此結果合併為整體蛆治療組癒合率。蛆組和親水凝膠處理組癒合時間無顯著差異(蛆v親水凝膠的癒合風險比值(HR)為1.13, 95%信賴區間 0.76 ~ 1.68; P = 0.54)。與親水凝膠組相比，蛆組治療顯著縮短了清創時間 (HR=2.31,1.65 - 3.2;P < 0.001;下圖)。結論是，與親水凝膠相比，蛆治療不能提高腿潰瘍的癒合率，但卻顯著減少了清創時間。

下列敘述何者為是(如果有的話)？

a)如果患者在追蹤期間內沒有進行清創術，他們的觀察將被“設限”(censored)

b)追蹤結束前未進行清創術的參與者被排除在分析之外

c)曲線的機率沒有達到1.0，因為一些觀察結果在追蹤結束時是設限的

d) log-rank test提供了治療組別間在清創前時間差異的估計值

e)隨著有清創風險的參與者減少，機率估計的準確性降低

答案：a, c, e正確，b, d錯誤

圖說明：用蛆法(鬆散和袋裝合併)與親水凝膠法比較潰瘍清創時間的Kaplan-Meier圖形。每個治療組別的中位存活時間為0.5機率對應的存活時間長度。

詳細說明：

本試驗研究了蛆療法對治療小腿潰瘍的有效性。採用隨機對照試驗設計。為便於分析，將鬆散蛆組和袋裝蛆組進行合併。結果包括隨機分組後至癒合時間和癒合後至清創時間。癒合和清創前的時間稱為“存活資料”(survival data)。一般而言，存活資料包括病人到達終點所需的時間。存活資料一詞可能具有誤導性，因為終點不一定是死亡或不良事件。在上述試驗中，終點可能為正面事件。存活資料通常被稱為“時間到事件資料”(time to event data)。

如果參與者在追蹤期間做了清創，他或她的存活時間被稱為“精確”(exact)。時間到事件資料的顯著特徵是，一些參與者在研究結束前沒有到達終點。在上述試驗中，追蹤期間未進行清創術的參與者，以追蹤時間長短作為存活時間。現時尚不清楚他們何時經歷清創，只知道清創發生在研究結束後的某個時間。因此，他們的存活時間被稱為”右設限” (right censored)或簡單的“設限” (a正確)。設限觀察值出現的主要原因有二。參與者可能被追蹤到最長時間，而在此期間沒有經歷清創術。其次，對於在招募結束時隨機接受治療的參與者，追蹤時間可能不夠長，無法進行清創術。一些參與者也可能因為退出研究或在進行清創術前失去追蹤而導致設限的觀察結果。存活數據的設限類型已於之前談過[2]。設限資料的參與者提供有關治療效果的有價值的資訊，因此仍包括在分析中(b錯誤)。

存活時間用Kaplan-Meier法計算後繪製成存活曲線(圖)。該方法假設設限與到達清創所需的時間無關。存活曲線是以”繪製的上升曲線”來描繪。圖上的時間點0代表最大符合條件的潰瘍癒合時間。在此階段，沒有參與者進行清創術，因此清創機率為0。只有當參與者經歷清創術時，曲線的機率才會增加。因此，這些曲線為一階梯式函數(step function)。計算機率時仍然包含設限觀察結果。然而，當觀察結果為設限時，存活曲線不會在機率上發生變化，而是在隨後”精確”的存活時間發生。機率，亦即Kaplan-Meier機率是累積的，因此顯示在追蹤期間不同治療組間在每個時間點及更早進行清創的比例 (proportion)。

追蹤結束時，兩組病人的存活曲線機率均未達到1.0。因為兩組參與者都有設限的觀察結果(c正確)。這些病人的清創時間超過最長追蹤時間。然而，如果最長的觀察追蹤時間是精確的而非設限的，那麼在追蹤結束時，存活曲線的機率將達到1.0。此外，如果在清創前沒有任何設限觀察值，那麼Kaplan-Meier機率將與絕對機率相等。

中位存活時間在描述time to event資料時特別重要。這是Kaplan-Meier機率為0.5的追蹤時間，代表平均生存時間。清創術前的中位存活時間是由機率為0.5的水平線與治療組別曲線相交的時間點得出（圖）。親水凝膠組到清創的中位時間為72天(95%信賴區間是56-131天)。信賴區間比較寬，說明樣本估計不準確。研究人員沒有報告蛆合併組的清創前中位時間。使用Kaplan-Meier圖(圖)來看，清創前的中位時間約為18天。因此，半數蛆治療組病人在潰瘍癒合後18天內(或更早)進行清創，而親水凝膠組為72天。

使用log rank test比較治療組別間的清創時間[3]。它提供不同組別間於追蹤期間內整體的存活時間之比較。它是基於傳統的統計假設檢驗概念，包括虛無假設和對立假設，已於之前說過[4]。虛無假設是從”相等”的位置開始，並指出在獲得樣本的母群體中，接受蛆治療和親水凝膠治療的參與者在清創時間上沒有差異。對立假設則為有差異存在。亦即在獲得樣本的母群體中，治療組別間的清創時間不相等。結果的P值小於0.001，因其小於0.05，虛無假設被拒絕，轉而支持對立假設。結論是，該試驗提供了不同治療方式在清創時間差異的證據。從圖可看出，蛆組的曲線高於親水凝膠組，由此可推斷，蛆組的值行清創時間比親水凝膠組短。Log rank test純粹是對顯著性的檢驗，並無提供治療組之間生存時間差異的估計值(d錯誤)。在前面的問題中說過的風險比值(Hazard ratio, HR)[5]，通常是為了提供這種差異的估計，並提供治療組間的相對存活時間之測量。在上述試驗中，與親水凝膠組相比，蛆組在清創前時間的HR為2.31(1.65-3.2)。HR是對追蹤期間內任何時間點相對於親水凝膠組的蛆組清創率(有時稱為瞬時風險)的估計。“風險”這個詞的使用可能具有誤導性——它在這裡是用來表示機率，而非不利結果的可能性。在追蹤期間的任何時候，與親水凝膠組相比，蛆組病人實現清創可能性是前者的2.31倍——也就是說，他們的風險增加了131%。此種風險的增加是顯著的，因其HR的95%信賴區間不包括1.0 (1.0表示治療組別間的清創率相等)。雖然信賴區間很寬，呈現在瞬時風險增加從65%到220%之間，但下限可能離1.0足夠遠，足以反映臨床上重要風險的增加。HR推導的前提假設為在追蹤期間內組別間的清創術執行相對危險性及它們的比值沒有很大變化。然而，如果存活曲線發生交叉，那麼這個假設就不成立，HR也就不是一個有用的測量指標。從HR無法預測何時會做清創，只知道蛆組明顯快於親水凝膠組。

在上述的Kaplan-Meier存活圖中可明顯看出上述治療組別間清創時間上的顯著差異。兩種治療的存活曲線在追蹤開始時急劇增加。80天后，蛆治療的Kaplan-Meier機率約為0.75，親水凝膠治療的Kaplan-Meier機率約為0.55。此後，曲線開始變平，在追蹤結束時，蛆組和親水凝膠組的機率分別約為0.95和0.78。

在Kaplan-Meier 存活圖中顯示各組病人在追蹤時間面臨清創的風險(即未執行清創)的人數。在研究即將結束時，這些數字下降了。因此，Kaplan-Meier 存活機率的精確性會降低，因為它們的計算是建立在參與人數減少的基礎上 (e正確)。與大多數典型的Kaplan-Meier曲線一樣，上述試驗的曲線在右側趨於平緩，因為完成清創的參與人數變少。須注意的是，不要過度解讀這種情形，除非仍有足夠大的觀察對象處於清創的風險中(即未執行清創的人數還是足夠大)。

Reference:

[1] Dumville JC, Worthy G, Bland JM, Cullum N, Dowson C, Iglesias C, et al; on behalf of the VenUS II team. Larval therapy for leg ulcers (VenUS II): randomised controlled trial. BMJ 2009;338:b773.

[2] Sedgwick P. Kaplan-Meier survival analysis: types of censored observations. BMJ 2013;347:f4663.

[3] Sedgwick P. The log rank test. BMJ 2010;341:c3773.

[4] Sedgwick P. Understanding statistical hypothesis testing. BMJ 2014;348:g3557.

[5] Sedgwick P. Hazards and hazard ratios. BMJ 2012;345:e5980.