Network Meta-analysis 研究常見問題

直接與間接證據、可傳遞性、PICO、節點定義、SUCRA 與證據品質——六個關鍵問答

匯東華統計顧問　·　陳秀敏博士　·　2026／6／15

ABSTRACT 摘要

本文以問答形式回應 Network Meta-analysis（NMA）研究中六個最常被提及的方法學問題，涵蓋 NMA 相對於成對統合分析的核心優勢、三大前提假設（同質性、可傳遞性、一致性）、介入節點界定的科學原則、網絡結構圖的判讀邏輯，以及 PICO 精準設定在 NMA 設計中的基礎地位。

文末聚焦於一個實務上最常被誤解的議題：SUCRA 排名第一，是否等於臨床最佳選擇？本文說明為何排序只是輔助資訊，並介紹如何結合 GRADE 與 CINeMA 架構對每一項比較進行系統性的證據確定性評估。

本文目標讀者為臨床研究者、統合分析實務工作者及統計顧問，期能作為進入 NMA 方法學核心的快速導引，協助讀者在研究設計與結果解讀兩個層面建立正確的方法論意識。

I證據網絡與核心優勢

問題 1：網絡統合分析（network meta-analysis，NMA）相比傳統成對統合分析（pairwise meta-analysis）的核心優勢是什麼？

NMA 的核心優勢在於能在同一統計模型中比較多種介入措施，並整合直接證據與間接證據。直接證據來自頭對頭研究，間接證據則可透過共同比較組推估，例如 A 與 C 均曾和 B 比較時，可間接推估 A 與 C 的相對效果。當某些介入之間缺乏直接比較，或直接比較研究數量不足時，NMA 可在證據網絡連通且核心假設合理的前提下，提供較完整的相對效果估計。NMA 也可呈現介入排序，但排序應作為輔助資訊，不能取代對效果量、證據確定性、安全性與臨床適用性的整體判斷。

KEY TAKEAWAY ｜本節重點

NMA 最大的優勢在於同時整合直接與間接證據，實現多種介入的同步比較；但排序結果只是輔助資訊，不能單獨作為臨床決策依據。

II三大核心假設

問題 2：開展 NMA 時，最關鍵的三個前提假設是什麼？哪一個最具挑戰性？

NMA 的可信度主要仰賴三項核心假設：同質性／異質性可接受、可傳遞性，以及一致性／相干性。同質性是指同一直接比較內的研究，在臨床與方法學上不應存在無法接受的差異；評估時不能只看 I²，也應考慮 τ²、預測區間、研究設計與臨床差異。一致性／相干性是指同一介入比較中，直接證據與間接證據的結果不應出現重要衝突，可透過局部或全域方法輔助檢查。

最具挑戰性的通常為可傳遞性，因為它要求不同直接比較之間，在重要效果修飾因子（Modifier）上具有足夠可比性，例如年齡、疾病嚴重度、共病、劑量、療程與結局測量方式等。可傳遞性無法單靠一個統計指標證明，必須從研究問題設計、PICO 界定、納入排除標準與效果修飾因子的分布進行系統性判斷。

KEY TAKEAWAY ｜本節重點

三大核心假設中，可傳遞性最難以驗證，因為它必須透過系統性的臨床判斷而非單一統計指標來評估；它是 NMA 可信度的根本基礎。

III介入節點界定

問題 3：如何科學地界定 NMA 中的介入節點（treatment node）？

介入節點的界定不能只是羅列藥物名或療法名，而應回到臨床問題本身。節點應在研究開始前預先定義，並說明合併或拆分的理由。原則上，節點內的介入應在作用機制、劑量、療程、給藥途徑、使用情境與目標族群上具有足夠相似性；節點之間則應保留有臨床意義的差異。

過度拆分會使每個節點的研究數與樣本數過少，造成估計不穩定；過度合併則可能引入異質性，破壞可傳遞性。因此，節點定義應兼顧臨床合理性、方法學可行性與決策需求，必要時可透過敏感度分析檢查不同節點設定對結果的影響。

KEY TAKEAWAY ｜本節重點

節點定義是 NMA 的關鍵設計決策，需在臨床合理性、方法學穩定性與決策需求之間取得平衡，並在研究啟動前預先說明合併或拆分的理由。

IV網絡結構圖判讀

問題 4：NMA 的網絡結構圖（network plot）能提供哪些臨床與方法學資訊？

網絡結構圖可直觀呈現不同介入之間的證據連結。一般而言，節點代表介入措施，連線代表兩介入之間存在直接比較研究；若圖中以節點大小、線條粗細或顏色呈現額外資訊，則需依照圖例判讀。網絡圖能夠幫助讀者了解哪些比較有較多直接證據、哪些節點證據薄弱、哪些介入只與少數比較組相連，以及網絡中是否存在閉環。

閉環結構可提供檢查直接與間接證據是否一致的機會；若研究品質良好且未發現重要不一致，對混合估計的信心會較高。相反地，若某些節點樣本數少、連結薄弱，或僅依賴少數小型研究，則代表該領域仍需要更多高品質頭對頭研究。

KEY TAKEAWAY ｜本節重點

網絡結構圖是診斷 NMA 證據基礎健全性的視覺工具：閉環意味著可進行一致性檢驗，節點薄弱或孤立則提示該比較的估計存在較大不確定性。

VPICO 的關鍵

問題 5：為什麼 PICO 的精準設定是 NMA 成敗的起點？

PICO 是 NMA 設計的基礎。若 Population 定義過於寬泛，可能混入疾病亞型、年齡層、共病狀態或疾病嚴重度差異很大的族群，進而增加異質性並威脅可傳遞性。若 Intervention 定義不清，例如未區分單一治療、合併治療、劑量、療程或治療線別，節點就可能失去臨床可比性。若 Outcome 未預先設定，或只選擇容易取得但臨床意義有限的指標，也會降低研究對臨床決策的價值。

實務上，NMA 應在研究開始前明確界定目標族群、介入與比較組、主要與次要結局、追蹤時間，以及可能影響治療效果的效果修飾因子。PICO 設定越清楚，後續的節點定義、文獻篩選、可傳遞性評估與結果解讀才越有可信基礎。

KEY TAKEAWAY ｜本節重點

PICO 精準設定是 NMA 一切的起點：Population 太寬破壞可傳遞性、Intervention 定義模糊使節點失去可比性、Outcome 未預設則降低臨床決策價值。

VI證據品質與 SUCRA

問題 6：如何客觀評估一篇 NMA 的證據品質與臨床適用性？僅看 SUCRA 排名第一是否足夠？

僅看 SUCRA 或「排名第一」絕對不夠。排序只能提供介入相對位置的摘要，不能單獨代表臨床最佳選擇。評估一篇 NMA 時，應先檢查研究問題與節點定義是否合理、可傳遞性是否充分論證、直接與間接證據是否一致、研究是否存在重要偏倚、異質性是否可接受，以及主要比較的效應估計是否精確。

若要比較排名第一與第二的介入，應查看兩者之間的相對效果估計與 95% CI／CrI，並判斷是否跨越無效值或未達預先設定之最小臨床重要差異（Minimal Clinically Important Difference，MCID），而不是只看排名。臨床決策還需同時考慮安全性、可近性、成本、患者偏好、共病與禁忌症。較穩妥的做法是結合 GRADE 或 CINeMA 等架構，從偏倚風險、間接性、不精確性、異質性、不一致性與報告偏倚等面向評估每一項比較的證據確定性。

KEY TAKEAWAY ｜本節重點

SUCRA 排名第一不等於臨床最佳選擇。評估 NMA 結果需結合效應估計的精確度、GRADE／CINeMA 的證據確定性評估，以及安全性、可近性、患者偏好等臨床考量。

延伸學習