"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

BMJ小小統計問題:Randomised controlled trials: understanding power(隨機對照試驗:理解統計檢力Power)

 

Cite this as: BMJ 2015;350:h3229

https://www.bmj.com/content/350/bmj.h3229
醫學統計、ChatGPT做研究、ChatGPT寫論文、統計分析

前言

本期文章深入探討 #隨機對照試驗 (randomised controlled trial) 中的 #統計檢力 (statistical power) 概念,並強調 #臨床顯著性 與 #統計顯著性 的差異及其在試驗設計中的重要性。文中指出,適當設計統計檢力和樣本數不僅是檢測臨床感興趣的最小效果量關鍵,還關係到結果的解釋性與應用價值。具備提升試驗設計的科學性與實務指導意義。文章包括許多實務應用上的重要概念,非常值得一讀!

 

另本人拙作”ChatGPT於系統性文獻回顧和統合分析之應用”於#台灣護理學會 發行之護理雜誌 2024年10月71卷 5期刊登,歡迎大家批評指教。往後會陸續發表本系列內容,也請大家持續關注。Hope u enjoy it!

10-11月份工作坊報名

11/22 (五) Live08:用別人的數據,做自己的研究:全科醫學公開資料庫介紹與應用,18:30~23:00,費用2,000元,會員免費。也有提供內容更完整的線上課程,新上市,優惠價2,880元。

2024/11/2(六) 第三期:網絡統合分析研究工作坊:實戰班

2024/11/3(日) 第三期:ws4-縱貫性研究設計與分析--重複測量分析法

2024/11/9(六) 第二期:醫學統計必修課(上):核心概念與基礎統計

2024/11/10(日) 第二期:醫學統計必修課(下):統計實戰,從入門到進階

 2024/11/20(三) Live09:Logistic regression與存活分析實戰篇

我們的目標:在AI時代來臨,能夠善用AI工具,擺脫耗時費力的瑣事,專注於更有價值的事務上,持續進化!

更多學習資源:

聯繫我們的官方LINE:@medatatw,感謝您一路相伴,讓我們在AI時代一起進化! ✨


 

問題:

一項探討手動淋巴引流對乳癌相關淋巴水腫發展的影響使用隨機對照試驗進行研究【1】。該介入措施為一個為期六個月的治療方案,內容包含關於淋巴水腫預防的指導、運動療法和手動淋巴引流。對照組接受與介入組相同的方案,但未包含關於手動淋巴引流的指導。參與者為比利時醫院接受單側腋下淋巴結清除之乳癌患者,追蹤長度為術後12個月。

 

主要結果指標包括上肢淋巴水腫的累積發病率。上肢淋巴水腫定義為手術前上臂體積增加200 mL或以上。樣本數的設定基於80%的統計檢力(power)以檢測兩組間在上肢淋巴水腫累積發病率中的20%差異,假設對照組在追蹤期的累積發病率為30%。樣本數計算假設使用雙尾假設檢定,顯著性水準設定為0.05(5%)。最終需要146名患者。為考量10%的預估脫落率,所需樣本量調整為160人。最終招募160名患者,分配79人至介入組及對照組81人。

 

整體而言,有154名(96.3%)患者完成追蹤,介入組有4人失聯,對照組有2人失聯。手術後12個月,介入組出現上肢淋巴水腫的比例高於對照組,但差異無統計學意義(24%(n=18)對19%(n=15);差異5%,95%信賴區間為−8%至18%;P=0.45)。研究結論為,手動淋巴引流加上淋巴水腫預防指導和運動療法在短期內無法顯著降低乳癌手術後的上肢淋巴水腫發病率。

 

下列敘述何者正確?

a) 主要結果的組間20%差異作為樣本數計算的基準,為臨床意義的最小效果量。

b) 若要達到100%的統計檢力,則需取樣整個母群體。
c) 試驗在主要結果的統計檢定上具有過高檢力。
d) 因主要結果組間差異無顯著性,可推論介入組與對照組效果相等。

 

 

 

答案:

a、b和c均正確,而d錯誤。

 

 詳細說明:

上述試驗的設計為優越性試驗(superiority trial),其目的是確定介入組是否在降低上肢淋巴水腫累積發病率方面優於對照組,或對照組是否效果更佳【2】。雖然預期介入組會在降低上肢淋巴水腫累積發病率方面優於對照組,但有時結果會出乎意料,因此必須進行統計假設檢定,以允許對照組效果可能優於介入組的情況。因此,使用雙尾檢定比較兩組在主要結果上的差異【3】。在計算上述試驗的樣本量時,需明確設定雙尾假設,因這將影響所需樣本數。在計算所需樣本數時,亦需確定顯著性水準,儘管在臨床試驗樣本數計算中通常使用標準的顯著性水準0.05(5%)。

 

研究者在試驗開始前需要計算最佳樣本數。所需的參與者數量基於兩組間主要結果的臨床顯著性差異。假設在術後12個月時,對照組的上肢淋巴水腫累積發病率為30%。該假設基於先前研究。若要使介入組被認為在臨床上有效且優於對照組,則介入組需要減少20%的累積發病率。此差異稱為【臨床意義的最小效果量】(a正確),為研究者根據臨床經驗或先前研究自訂的。顯然,若組間差異大於該最小效果量,將顯示臨床優越性,而小於該差異則不顯著。若對照組顯示出累積發病率減少20%或更多,則亦會顯示統計顯著性。

 

臨床意義的最小效果量可能不一定存在於母群體中。換言之,若將干預應用於整個母群體,兩組間上肢淋巴水腫累積發病率的差異可能小於20%。然而,若該最小效果量存在於母群體中,則需將在RCT中觀察到的統計意義可能性最大化。實現此目標需具備最佳樣本數,亦即,統計檢力之意義。檢力基於無限次重複試驗且條件相同的假設,尤其是樣本數保持一致。使用隨機抽樣從母群體中選取樣本,因此每個試驗的樣本估計值會有所差異。每次試驗均會進行統計假設檢定,產生對干預效果比較的P值。這些P值在大小上會有所差異。若在無限重複樣本中,檢測到臨床意義的最小效果量並顯示其具有統計意義(P<0.05),則其百分比即為樣本量計算的統計檢力。統計檢力在計算所需樣本數時即已設定。上述試驗中,統計檢力設定為80%。因此,假設母群體中存在臨床意義的最小效果量,則無限樣本中會有80%將顯示顯著性(P<0.05)。

 

若最小效果量在母群體中存在,則需確保在試驗中有足夠的機會觀察到此效果量,即需盡量增加統計檢力。然而,隨著樣本數增加,統計檢力亦會增加。此概念直觀上成立,因為當樣本數增大並接近母群體時,試驗中累積發病率差異的樣本估計值會逐漸接近母群體參數。因此,隨著樣本數增大,統計檢力亦提高,因為在試驗中更可能觀察到母群體中存在的最小效果量。若要達到100%的統計檢力,則需取樣整個母群體(b正確),但在實務上並不可行。因此,在確定試驗所需樣本數時,需在統計檢力和樣本數間取得平衡。上述試驗中,統計檢力設定為80%,此為臨床試驗中樣本數計算時普遍建議之最低值。

 

在設計試驗時,確定最佳樣本數是重要的倫理考量。試驗需具備足夠的統計檢力。若樣本數過小,則試驗可能無法具備足夠的統計檢力以辨識母群體中存在的最小效果量。這可能不符合倫理,因為試驗執行耗費時間、精力和資源,卻缺乏顯示臨床顯著性的潛力。同樣地,若樣本數過大,則會招募超出辨識最小效果量所需的參與者數量。同樣不符合倫理,因為招募過多參與者亦浪費時間、精力和資源。

 

在上述試驗的樣本數計算中,統計檢力設定為80%。若母群體中存在臨床意義的最小效果量,則需招募146名女性以在試驗中觀察到並顯示其具有統計顯著性。樣本數調整考量10%的預估脫落率,最終為160人。樣本數計算假設兩組參與者數量相等。總共招募160名女性,其中154名完成追蹤(介入組n=75,對照組n=79)。實際脫落率為3.7%,低於樣本數計算時估計的10%脫落率。因此,所招募的參與者數量超出辨識臨床意義的最小效果量所需的樣本數。因所招募的參與者數量超出所需數量,此時,統計檢力高於樣本數計算時設定的80%。當試驗統計檢力超出樣本數計算設定時,稱為檢力過大(overpowered)(c正確)。

 

在基於試驗結果得出結論時,需理解統計檢力與統計顯著性間的關係。特別是,組間在主要結果上顯示統計顯著性時,可能並不具備臨床顯著性。上述試驗具有過高統計檢力。亦即,雖然能保持所設定的80%統計檢力,但組間上肢淋巴水腫累積發病率差異可能小於臨床意義的最小效果量,卻顯示統計顯著性。換句話說,可能存在小於臨床意義的最小效果量且無臨床顯著性差異卻被辨識為統計顯著性【4】。

 

手術後12個月,介入組的上肢淋巴水腫比例高於對照組(24%對19%)。然而,差異無統計顯著。此結果出乎預期,因為預期介入組累積發病率會低於對照組。雖然組間在主要結果上無顯著性差異,但無法推論介入組與對照組在減少上肢淋巴水腫累積發病率方面效果相等(d錯誤)。基於此結果可得出的推論為,無證據顯示組間在上肢淋巴水腫累積發病率上存在差異,而非無差異。可見之前問題「沒有證據不等於證明不存在」(#BMJ小小統計問題142)【5】。換言之,僅因統計假設檢定無法發現組間結果差異,不代表在母群體中不存在差異。儘管母群體中可能存在差異,但該試驗並未顯示此差異,因參與試驗者僅為母群體中之單一樣本;其他樣本可能顯示不同的估計值,並可能得出顯著性結果。儘管此試驗有相對較高的統計檢力(80%)。

 

Reference:

[1] Devoogdt N, Christiaens MR, Geraerts I, et al. Effect of manual lymph drainage in addition to guidelines and exercise therapy on arm lymphoedema related to breast cancer: randomised controlled trial. BMJ 2011;343:d5326.

[2] Sedgwick P. What is a superiority trial? BMJ 2013; 347: f5420.

[3] Sedgwick P. Understanding statistical hypothesis testing. BMJ 2014; 348: g3557.

[4] Sedgwick P. Clinical significance versus statistical significance. BMJ 2014; 348: g2130.

[5] Sedgwick P. Understanding why “absence of evidence is not evidence of absence” BMJ 2014; 349: g4751.

 

#匯東華 #BMJ統計問題 #醫學統計 #隨機對照試驗 #統計檢力 #臨床顯著性 #統計顯著性 #醫學研究方法 #統計學應用

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。