"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

BMJ小小統計問題(120):Randomised controlled trials: missing data (隨機對照控制試驗:遺漏值)

Cite this as: BMJ 2014;349:g4656

https://www.bmj.com/content/349/bmj.g4656

                                                   

前言

本期小小統計問題談的主題很重要,在談遺漏值的處理以及造成的影響。遺漏值的處理方式有很多,常見的可能是直接刪除遺漏個案、使用平均值、眾數進行插補,或是本期提到的BOCF和LOCF。但這些做法均會造成偏差。而近年來隨著大量處理遺漏值的方法被開發出來,迴歸平均法、多重插補(multiple imputation)甚至隨機森林插補法已經屢見於品質良好的文章。本公司也提供多種進階插補法服務,有需要可洽詢。Hope u enjoy it


-----

路徑:匯東華官網/學習專區/BMJ小小統計問題

匯東華[課程招生中]

流行病學與生物統計慶新年:新版教材上市優惠開跑 [至2024年1月31日]


2023/12月課程

✅「12/17(日):AI03-Step by Step ChatGPT高效醫學論文寫作:關聯性研究」08:30-17:30招生中!


  • 2024年一月課程招生中!

-----

✨本公司提供【流行病學】與【生物統計學】線上課程,請至匯東華統計學院

匯東華會員制

更多課程介紹與報名資訊


-----

問題

    研究人員對一系列體重管理計畫的減肥效果進行評估。研究採用隨機對照試驗設計,包括八個治療組別。每項介入措施—"Weight Watchers”、”Slimming World”、”Rosemary Conley”、以小組為基礎的營養學主導計畫、醫生一對一諮詢、藥房主導的一對一諮詢,以及六項計畫中的任意一項--持續 12 周。對照組治療包括 12 張可免費進入當地休閒(健身)中心的抵用券。參與者為 740 名肥胖或超重的男性和女性[1]。

主要結果是計畫結束時(12 周)的體重減輕情況。次要結果包括一年後的體重減輕情況。所有參與者都有基線特徵,658 名參與者(88.9%)在計畫結束時有追蹤資料,522 名參與者(70.5%)在一年後有追蹤資料。

 

根據治療意向(intention to treat)進行分析,並使用”baseline observation carried forward” (BOCF)法來處理缺失資料。從基線到專案結束,所有治療專案都取得顯著的體重減輕效果。與 12 周時的對照治療相比,體重減輕幅度明顯更大的治療方案只有 "Weight Watchers "(平均差異為 2.53 千克,95% 信賴區間為 1.30 - 3.76;P<0.001)和Rosemary Conley(2.18,0.96 - 3.41;P=0.004)。除醫生和藥房提供的方案外,所有方案都能在一年後顯著減輕體重。一年後,只有 " Weight Watchers "計畫的減重效果明顯高於對照組(2.5 千克,0.8 - 4.2;P=0.022)。結論是,商業提供的體重管理服務比以初級保健為基礎的服務更有效。

對於baseline observation carried forward,下列敘述何者正確?

a) 保持治療組間基線的可比性

b) 對於僅在基線時測量體重的參與者,該方法假定他們在追蹤期間體重沒有變化

c) 它導致樣本估計值的信賴區間過窄,從而高估準確性

 

答案

a、b 和 c 三項說法均正確。

 


詳細說明

  該試驗旨在評估一系列體重管理計畫對減肥的效果。試驗採用隨機對照研究設計。所有參與者均有結果測量值和基線特徵,而 658 名參與者(88.9%)在計畫結束時(12 周)和 522 名參與者(70.5%)在一年後可提供追蹤資料。

  試驗參與者的結果測量資料缺失很常見。一般稱為 "遺漏值",出現這種情況的原因很多。參與者可能沒有開始接受隨機分配的治療,可能失去追蹤機會,或者在追蹤期間沒有按要求提供結果測量資料。在試驗分析中如何處理遺漏值會對結果產生明顯影響,進而影響結論。

  在本例中,處理遺漏值最直接的方法是排除那些在追蹤期間沒有提供所有結果測量資料之參與者。此法被稱為"完整病例分析"(complete case analysis)。但是,如果遺漏值的發生與治療或結果有關,此種方法可能會在治療組的比較中引入干擾因素。參與者被隨機分配到治療組,若試驗的樣本量夠大,隨機化的目的是產生基線特徵相似的病人組別。這些因素包括人口統計學、預後因素以及影響參與者參與試驗的特徵。因此,治療組間在治療結果上的任何差異都是由於所接受治療的不同而非基線特徵的不同所導致,因此,試驗具有內部效度(internal validity)[2]。內部效度是指觀察到的治療效果可歸因於治療差異而非干擾因素的程度。然而,若將遺漏值排除於分析外,就會引入干擾因素,因為基線特徵的平衡將不復存在。因此,內部效度將受到威脅。此外,排除參與者最終會導致統計檢力下降。

  插補(Imputation)是刪除遺漏值的另一種方法。意旨用一個可信的資料值代替遺漏值,這個資料值可以是現有的值,也可以是根據參與者現有資料預測出來的值。在上述試驗中,遺漏值是用"baseline observation carried forward"的方法來估算。該法為,參與者在基線時的結果測量值被用於追蹤期間所有時間點的遺漏值。此種方法簡單明瞭。特別是,它能確保所有隨機病人都被能納入分析,從而保持治療組間基線的可比性(a正確),並最大限度地減少干擾因素。

  在資料缺失的情況下,很難預測參與者在 12 周或一年後的體重。毫無疑問,所有參與者的體重在追蹤期間都會發生一些變化,無論是增加或是減少。使用baseline observation carried forward的方法為在追蹤期間的所有遺漏值,始終使用參與者在基線時的結果測量值。該方法假設在 12 周和一年時沒有測量體重的參與者之體重在追蹤期間與基線相比沒有變化(b正確)。但此種情況不太可能發生,因此該方法提供的結果測量值可能存在偏差,從而導致樣本估計值存在偏差。@@@除了使用baseline observation carried forward法對遺漏值進行插補外,研究人員還使用last observation carried forward(LOCF)法對缺失資料進行插補分析。與BOCF相似,使用LOCF法亦即所有隨後的遺漏值都將使用參與者的最後一次結果測量值取代。此法假設參與者的體重與他們最後一次記錄體重時的體重保持不變。然而,這似乎並不靠譜。LOCF法被用作敏感性分析的一部分。由於這些遺漏值的插補法可能會使樣本估計值出現偏差,因此會使用這兩種方法來評估它們是否會產生相似的結果。然而,此兩種插補法都可能低估試驗中某一治療方法的體重變化結果之標準差,導致信賴區間過窄,造成估計值的準確性高估(c正確)。由於此兩種插補法都可能導致治療組的樣本估計值出現偏差,因此治療組間的任何比較都將失準。

  雖然BOCF和LOCF有一定優勢,但由於上述原因,一般不鼓勵將其作為估算方法。最近,在發展估算方法方面開展許多方法學工作。包括迴歸平均插補(regression mean imputation)和多重插補(multiple imputation)在內的更複雜的方法已被開發出來,這些方法被認為能提供更可信和無偏見的數值。

 

Reference:

[1] Jolly K, Lewis A, Beach J, Denley J, Adab P, Deeks JJ, et al. Comparison of range of commercial or primary care led weight reduction programmes with minimal intervention control for weight loss in obesity: Lighten Up randomised controlled trial. BMJ 2011;343:d6500.

[2] Sedgwick P. Randomised controlled trials: internal versus external validity. BMJ 2014;348:g1742.

#匯東華 #BMJ統計問題 #missing data #多重插補 #last observation carried forward #baseline observation carried forward

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。