匯東華統計顧問有限公司
"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~
第172題:Cluster randomised controlled trials: sample size calculations (集群隨機對照試驗:樣本數計算)
你是否曾經困惑於如何在 #集群隨機對照試驗(Cluster Randomised Controlled Trials, CRTs) 中計算 #樣本數?本期文章聚焦於 #集群內相關係數(Intracluster Correlation Coefficient, ICC),此一重要指標如何幫助研究者解決 #集群效應 帶來的考量。若忽略集群效應導致的資料相關性(非獨立性)問題,可能低估所需樣本數,導致研究檢力不足(underpowered study)。本文以基層診所健康行為介入研究為案例,文章生動解析 ICC 在樣本數調整中的應用,並且剖析 ICC 與 #設計效應(Design Effect) 的計算邏輯,還對比其與 #傳統相關係數 的不同,幫助讀者更好地理解如何處理集群內數據的相關性。無論你是 #醫學研究者 還是 #統計學家,本文都能為你提供實用的見解與靈感,值得一讀!另,相關概念也可見上期(171期)的#Intraclass correlation coefficient。
本人拙作”ChatGPT於系統性文獻回顧和統合分析之應用”於#台灣護理學會 發行之護理雜誌 2024年10月71卷 5期刊登,歡迎大家批評指教。往後會陸續發表本系列內容,也請大家持續關注。Hope u enjoy it!
【線上課程】ePMD02:用別人的數據,做自己的研究:全科醫學公開資料庫介紹與實例應用,原價6,000元,優惠價2,880元。找不到研究數據來源嗎?請看本課程!
概念 + 實作 + 無須任何程式碼 = 專業 + 品質 + 效率
【現場+直播】12/28(六)~12/29(日),WS5- & 6:R語言:臨床預測模型:基礎班、實戰班
更多學習資源:
聯繫我們的官方LINE:@medatatw,感謝您一路相伴,讓我們在AI時代一起進化! ✨
研究人員評估對基層醫療專業人員進行輔導訓練,以促進病人進行與健康相關行為改變之效果。該研究採用以一般診所為隨機化單位的集群隨機試驗(Cluster Randomised Trial)。介入措施包括針對四種風險行為(吸菸、飲酒、運動和健康飲食)進行行為改變輔導;對照組接受標準治療[1]。
主要結局指標為病人自述在三個月內至少對四種風險行為之一做出有益的改變比例。樣本數計算基於以下假設:介入組在三個月內報告有益行為改變的病人比例將從對照組的50%提升至65%。為達到此一目標,若採用簡單隨機分配的隨機對照試驗,設定統計檢力(power)為80%,顯著性水準(alpha)為0.05,則需要340名病人。然而,考慮到隨機化診所中的集群效應(clustering effects),研究人員採用集群內相關係數(Intracluster Correlation Coefficient, ICC)為0.05的調整。導致所需樣本數增至1104名病人,分布於24個診所,每個診所招募46名病人。研究人員報告稱,對基層醫療專業人員進行行為改變輔導訓練,並未提高病人在三個月內自述的有益行為改變比例。
下列敘述何者正確?
a) 對於同一診所內病人,其主要結局測量值傾向於相關。
b) 若同一診所內的病人主要結局測量值相關,則需增加樣本數以顯示臨床感興趣的最小效果。
c) 集群內相關係數的取值範圍為 -1 至 1,包括 0。
a、b 正確, c 錯誤。
集群隨機對照試驗有於問題進行說明[2]。本例中,隨機化單位為獨立之一般診所(即集群),而非病人本身。這些集群是自然的人群分組。每一診所中的所有病人都接受其診所分配的治療——介入組或對照組。診所被稱為分配單位(unit of allocation)。
採用集群隨機試驗設計的優勢在於克服使用簡單隨機分配可能出現的污染(contamination)問題。若採用簡單隨機分配,可能導致同一診所的病人被分配到不同治療組。若在同一診所中同時實施介入與對照治 療,對某些病人實施介入,對其他病人不實施,將可能難以操作。此外,在同一診所內,接受介入的病人可能會影響接受對照治療病人的行為,或反之亦然。
同一診所內病人的主要結局測量值傾向相關(a 正確)。此外,同一診所內之結局測量值彼此間會比不同診所間的測量值更為相似。此因同一診所內的病人通常具有相似的特徵,例如社會經濟及人口統計特徵,而這些特徵會影響結局。此外,儘管行為改變輔導的培訓是標準化的,但基層醫療專業人員在不同診所中執行介入的方式可能略有不同。
傳統的樣本數計算假設主要結局在病人間為彼此獨立。但對於上述集群隨機對照試驗,此一假設並不成立,因同一診所內病人的結局會比不同診所間的結局更相似。若未考慮診所內病人之間的相關性,可能導致研究檢力不足(underpowered)。若計算出的樣本數過小,將不足以檢測到臨床感興趣的最小效果(minimal clinically important difference, MCID),如本例設定為介入組中病人在三個月內報告有益行為改變的比例從對照組的50%提高到65%。由於診所內病人的結局傾向於相關,因此需要更大的樣本數來檢測MCID(b正確)。若假設病人的結局為彼此獨立,則樣本數計算可以基於簡單隨機分配的隨機對照試驗。
為考慮上述例子中診所內病人主要結局之相關性,使用集群內相關係數(intracluster correlation coefficient, ICC)進行樣本數調整。此一係數用於基於簡單隨機分配的隨機對照試驗的樣本數計算,並進一步擴大樣本數。集群內相關係數以希臘字母ρ表示,其性質與之前問題中描述的組內相關係數(intraclass correlation coefficient, ICC)[3]相似。
集群內相關係數的推導基於對主要結局測量總變異的分析,這些變異可以分為兩個來源:第一,集群內的變異;第二,集群間的變異。集群內相關係數透過比較集群內變異與集群間變異來考量主要結局的相關性。其推導公式為:
集群內相關係數 = 集群間變異 ÷(集群內變異 + 集群間變異)。
與皮爾森(Pearson)和斯皮爾曼(Spearman)相關係數不同,ICC 的取值範圍僅限於 0 到 1(c 錯誤)。皮爾森與斯皮爾曼相關係數的取值範圍是 -1 至 1,並已在之前的問題中描述過 [4, 5]。ICC 的測量不具有單位。當 ICC 的值為 1 時,指集群內病人間的主要結局沒有任何相關性,所有變異均來自於集群間之變異。而當 ICC 接近 0 時,則表示集群內變異遠大於集群間變異。
為了考慮集群內病人之間缺乏獨立性的情況,集群隨機試驗的樣本數應透過一個稱為設計效應(Design Effect)之因子來增加。設計效應,有時也稱為變異膨脹因子(Variance Inflation Factor),計算公式為:
設計效應 = 1 + (n − 1)ρ
其中,n 是集群的平均規模,ρ 是對特定結局的 ICC。一般而言,ICC 的值越大,設計效應的值也越大。
在本案例中,MCID為病人在三個月內報告至少一種健康行為(如戒菸或健康飲食)有益改變的比例從 50% 提高到 65%。若假設病人間之主要結局完全無相關性,則需要 340 名病人的樣本數,基於簡單隨機分配的隨機對照試驗進行研究。然而,為了考慮診所內主要結局的集群效應,應用一個 ICC 值為 0.05。假設每個診所招募 46 名病人,設計效應計算如下:
設計效應 = 1 + (46 − 1) × 0.05 = 3.25
因此,基於簡單隨機分配的樣本數必須乘以 3.25,結果為 1104 名病人(b 正確的)。這些病人分布在 24 個診所,每個診所招募 46 名病人。
一般而言,在臨床研究中,ICC 的值介於 0.01 至 0.02 間,其計算通常需要透過預試研究(Pilot Study)。然而,預試研究並非總是可行,ICC 的選擇常基於已發表的試驗數據。在上述案例中,研究人員缺乏具體證據來支持其選擇的 ICC 值,因此基於既有文獻中的發現,合理地選擇了一個適用於基層診所的 ICC 值。
Reference:
[1] Butler CC, Simpson SA, Hood K, Cohen D, Pickles T, Spanou C, et al. Training practitioners to deliver opportunistic multiple behaviour change counselling in primary care: a cluster randomised trial. BMJ 2013;346:f1191.
[2] Sedgwick P. Cluster randomised controlled trials. BMJ 2012;345:e4654.
[3] Sedgwick P. Intraclass correlation coefficient. BMJ 2013;346:f1816.
[4] Sedgwick P. Pearson’s correlation coefficient. BMJ 2012;345:e4483.
[5] Sedgwick P. Correlation. BMJ 2012;345:e5407.
#匯東華 #醫學統計 #統計學 #醫學研究 #樣本數計算 #數據分析 #集群效應 #隨機對照試驗 #研究設計 #intraclass correlation coefficient #ICC #Cluster Effect
數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。
全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。
Fig1.同一個Project資料散落在不同tables,無法使用
Fig2.整併與清理為可分析的table
Fig.3整理和分析後形成有意義的知識
概念與流程示意圖
課程規劃核心為以「學習者」為中心進行「傳承」
以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。
開設線上統計學院
SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)
課程網址:https://medata.teaches.cc/
課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M
課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E
臨床研究思維-Open your mind
課程網址:https://medata.teaches.cc/
課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk
為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。