曇月靈
匯東華
Network Meta-analysis 專欄

Network Meta-analysis 研究常見問題

直接與間接證據、可傳遞性、PICO、節點定義、SUCRA 與證據品質——六個關鍵問答

匯東華統計顧問 · 陳秀敏 博士 · 2026/6/15

ABSTRACT 摘要

本文以問答形式回應 Network Meta-analysis(NMA)研究中六個最常被提及的方法學問題,涵蓋 NMA 相對於成對統合分析的核心優勢、三大前提假設(同質性、可傳遞性、一致性)、介入節點界定的科學原則、網絡結構圖的判讀邏輯,以及 PICO 精準設定在 NMA 設計中的基礎地位。

文末聚焦於一個實務上最常被誤解的議題:SUCRA 排名第一,是否等於臨床最佳選擇?本文說明為何排序只是輔助資訊,並介紹如何結合 GRADE 與 CINeMA 架構對每一項比較進行系統性的證據確定性評估。

本文目標讀者為臨床研究者、統合分析實務工作者及統計顧問,期能作為進入 NMA 方法學核心的快速導引,協助讀者在研究設計與結果解讀兩個層面建立正確的方法論意識。

I證據網絡與核心優勢

問題 1:網絡統合分析(network meta-analysis,NMA)相比傳統成對統合分析(pairwise meta-analysis)的核心優勢是什麼?

NMA 的核心優勢在於能在同一統計模型中比較多種介入措施,並整合直接證據與間接證據。直接證據來自頭對頭研究,間接證據則可透過共同比較組推估,例如 A 與 C 均曾和 B 比較時,可間接推估 A 與 C 的相對效果。當某些介入之間缺乏直接比較,或直接比較研究數量不足時,NMA 可在證據網絡連通且核心假設合理的前提下,提供較完整的相對效果估計。NMA 也可呈現介入排序,但排序應作為輔助資訊,不能取代對效果量、證據確定性、安全性與臨床適用性的整體判斷。

KEY TAKEAWAY | 本節重點

NMA 最大的優勢在於同時整合直接與間接證據,實現多種介入的同步比較;但排序結果只是輔助資訊,不能單獨作為臨床決策依據。

II三大核心假設

問題 2:開展 NMA 時,最關鍵的三個前提假設是什麼?哪一個最具挑戰性?

NMA 的可信度主要仰賴三項核心假設:同質性/異質性可接受、可傳遞性,以及一致性/相干性。同質性是指同一直接比較內的研究,在臨床與方法學上不應存在無法接受的差異;評估時不能只看 I²,也應考慮 τ²、預測區間、研究設計與臨床差異。一致性/相干性是指同一介入比較中,直接證據與間接證據的結果不應出現重要衝突,可透過局部或全域方法輔助檢查。

最具挑戰性的通常為可傳遞性,因為它要求不同直接比較之間,在重要效果修飾因子(Modifier)上具有足夠可比性,例如年齡、疾病嚴重度、共病、劑量、療程與結局測量方式等。可傳遞性無法單靠一個統計指標證明,必須從研究問題設計、PICO 界定、納入排除標準與效果修飾因子的分布進行系統性判斷。

KEY TAKEAWAY | 本節重點

三大核心假設中,可傳遞性最難以驗證,因為它必須透過系統性的臨床判斷而非單一統計指標來評估;它是 NMA 可信度的根本基礎。

III介入節點界定

問題 3:如何科學地界定 NMA 中的介入節點(treatment node)?

介入節點的界定不能只是羅列藥物名或療法名,而應回到臨床問題本身。節點應在研究開始前預先定義,並說明合併或拆分的理由。原則上,節點內的介入應在作用機制、劑量、療程、給藥途徑、使用情境與目標族群上具有足夠相似性;節點之間則應保留有臨床意義的差異。

過度拆分會使每個節點的研究數與樣本數過少,造成估計不穩定;過度合併則可能引入異質性,破壞可傳遞性。因此,節點定義應兼顧臨床合理性、方法學可行性與決策需求,必要時可透過敏感度分析檢查不同節點設定對結果的影響。

KEY TAKEAWAY | 本節重點

節點定義是 NMA 的關鍵設計決策,需在臨床合理性、方法學穩定性與決策需求之間取得平衡,並在研究啟動前預先說明合併或拆分的理由。

IV網絡結構圖判讀

問題 4:NMA 的網絡結構圖(network plot)能提供哪些臨床與方法學資訊?

網絡結構圖可直觀呈現不同介入之間的證據連結。一般而言,節點代表介入措施,連線代表兩介入之間存在直接比較研究;若圖中以節點大小、線條粗細或顏色呈現額外資訊,則需依照圖例判讀。網絡圖能夠幫助讀者了解哪些比較有較多直接證據、哪些節點證據薄弱、哪些介入只與少數比較組相連,以及網絡中是否存在閉環。

閉環結構可提供檢查直接與間接證據是否一致的機會;若研究品質良好且未發現重要不一致,對混合估計的信心會較高。相反地,若某些節點樣本數少、連結薄弱,或僅依賴少數小型研究,則代表該領域仍需要更多高品質頭對頭研究。

KEY TAKEAWAY | 本節重點

網絡結構圖是診斷 NMA 證據基礎健全性的視覺工具:閉環意味著可進行一致性檢驗,節點薄弱或孤立則提示該比較的估計存在較大不確定性。

VPICO 的關鍵

問題 5:為什麼 PICO 的精準設定是 NMA 成敗的起點?

PICO 是 NMA 設計的基礎。若 Population 定義過於寬泛,可能混入疾病亞型、年齡層、共病狀態或疾病嚴重度差異很大的族群,進而增加異質性並威脅可傳遞性。若 Intervention 定義不清,例如未區分單一治療、合併治療、劑量、療程或治療線別,節點就可能失去臨床可比性。若 Outcome 未預先設定,或只選擇容易取得但臨床意義有限的指標,也會降低研究對臨床決策的價值。

實務上,NMA 應在研究開始前明確界定目標族群、介入與比較組、主要與次要結局、追蹤時間,以及可能影響治療效果的效果修飾因子。PICO 設定越清楚,後續的節點定義、文獻篩選、可傳遞性評估與結果解讀才越有可信基礎。

KEY TAKEAWAY | 本節重點

PICO 精準設定是 NMA 一切的起點:Population 太寬破壞可傳遞性、Intervention 定義模糊使節點失去可比性、Outcome 未預設則降低臨床決策價值。

VI證據品質與 SUCRA

問題 6:如何客觀評估一篇 NMA 的證據品質與臨床適用性?僅看 SUCRA 排名第一是否足夠?

僅看 SUCRA 或「排名第一」絕對不夠。排序只能提供介入相對位置的摘要,不能單獨代表臨床最佳選擇。評估一篇 NMA 時,應先檢查研究問題與節點定義是否合理、可傳遞性是否充分論證、直接與間接證據是否一致、研究是否存在重要偏倚、異質性是否可接受,以及主要比較的效應估計是否精確。

若要比較排名第一與第二的介入,應查看兩者之間的相對效果估計與 95% CI/CrI,並判斷是否跨越無效值或未達預先設定之最小臨床重要差異(Minimal Clinically Important Difference,MCID),而不是只看排名。臨床決策還需同時考慮安全性、可近性、成本、患者偏好、共病與禁忌症。較穩妥的做法是結合 GRADECINeMA 等架構,從偏倚風險、間接性、不精確性、異質性、不一致性與報告偏倚等面向評估每一項比較的證據確定性。

KEY TAKEAWAY | 本節重點

SUCRA 排名第一不等於臨床最佳選擇。評估 NMA 結果需結合效應估計的精確度、GRADE/CINeMA 的證據確定性評估,以及安全性、可近性、患者偏好等臨床考量。

本文由匯東華統計顧問有限公司 陳秀敏 博士撰稿,智慧體部智澄辰(Claude Opus 4.8)協助內容整理與 HTML 結構化,最終內容已由作者審閱定稿。日期:2026 年 6 月 15 日。

聯絡我們

 統計分析

服務價目表 (未含5%營業稅)
透過嚴謹的數據整理,提供有價值的資訊,形塑知識,提高決策品質。包括信達雅三執行原則。

 信:確保資料品質可信賴
 達:確保統計方法適切性
 雅:確保圖文表格正規化
協助代執行統計分析與進一步加值服務。

在匯東華與夥伴的專業背景知識配合下,能有效地處理面對的問題。
統計分析成果

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。