匯東華統計顧問有限公司
"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~
第175題:Cluster sampling (集群抽樣)
最近公司業務繁忙,本期出刊時間晚了些。本期文章深入探討 #集群抽樣法(Cluster Sampling)之應用及其在臨床試驗中的實際做法。以戒菸介入研究為例,本文詳細解析如何通過集群抽樣法提升參與者招募效率,並有效減少治療組間的干擾。同時,文章也對集群抽樣的潛在限制進行剖析,特別是當抽樣過程涉及便利抽樣時,如何影響樣本的代表性。對於地理分散的研究情境,集群抽樣提供一種高效的資源分配策略,對 #公共衛生研究 和 #臨床試驗設計 有著重要的參考價值。此外,相關文章可見 #BMJ小小統計問題173題,結合閱讀將幫助你更為全面理解該方法的特點與實踐。
本人拙作”ChatGPT於系統性文獻回顧和統合分析之應用”於#台灣護理學會 發行之護理雜誌 2024年10月71卷 5期刊登,歡迎大家批評指教。往後會陸續發表本系列內容,也請大家持續關注。Hope u enjoy it!
【線上課程】ePMD02:用別人的數據,做自己的研究:全科醫學公開資料庫介紹與實例應用,原價6,000元,優惠價2,880元。找不到研究數據來源嗎?請看本課程!
概念 + 實作 + 無須任何程式碼 = 專業 + 品質 + 效率
【現場+直播】1/11(六)~1/12(日),網絡統合分析研究工作坊
更多學習資源:
聯繫我們的官方LINE:@medatatw,感謝您一路相伴,讓我們在AI時代一起進化! ✨
研究者調查為成人住院吸菸者提供戒菸支持的效果。研究採用集群隨機對照試驗設計。介入措施包括系統性記錄吸菸狀況,並在住院期間默認提供行為支持與戒菸藥物治療,追蹤並轉介至出院後的社區服務。對照組則接受常規護理,由臨床工作人員根據其判斷自主提供戒菸支持【1】。
研究參與者通過集群抽樣法招募。吸菸者與最近戒菸病人在2010年10月11日至2011年8月9日期間於一所英國大型教學醫院的18個急性醫療病房內被邀請參與研究。共招募493名病人。病房通過隨機分配進行分組,並根據每週出院人數進行分層。9個病房被分配至介入組,9個病房被分配至對照組,結果介入組有264名病人接受治療,對照組有229名病人接受治療。
主要結局指標為4週後之戒菸情況,通過測量呼出的碳氧化物進行驗證。介入組在4週後的戒菸比例高於對照組(調整後OR為2.10,95%信賴區間為0.96至4.61;P=0.06)。研究結論認為,通過系統性記錄並提供戒菸支持,住院吸菸者與最近戒菸者之戒菸效果能夠得到改善。
下列敘述何者正確?(複選題)
a) 集群抽樣法涉及從每個病房中隨機招募成人病人
b) 集群抽樣法用於減少治療過程中,組間之干擾
c) 集群抽樣法的定義屬於機率抽樣
b、c正確,a錯誤。
本試驗的目的是調查為住院成人吸菸者和最近戒菸者系統性提供戒菸支持的效果。對照組接受常規護理,戒菸支持由臨床人員根據其判斷自主提供。參與者通過集群抽樣法招募,所有在2010年10月11日至2011年8月9日期間住院的成人吸菸者與最近戒菸者均被邀請參加。
集群是自然形成的群體,例如選區、診所、學校。集群抽樣法涉及從群體中隨機選取一組集群,並邀請被選中集群中的所有成員參加(a錯誤)。需要構建包含所有集群之抽樣框架,從中隨機選取固定數量的集群。每個集群被選中的機率相同且獨立。然而,如果集群大小不同,選擇的機率可能與集群大小成正比,較大的集群被選中的機率較高。獲取集群隨機樣本可能耗時、昂貴且操作困難,特別是當集群在地理上較為分散時。因此,集群抽樣有時會從便於選取的地理區域中隨機選取集群。
在本例中,原本可以使用簡單隨機抽樣從群體中招募病人。需要先構建一個抽樣框架——即列出所有屬於該群體之成員名單。然後,從此名單中隨機選取固定數量的樣本,所有群體成員被選中的機率相等且相互獨立。然而,此種抽樣方法可能導致樣本成員在地理上分佈非常分散。因此,研究選擇針對醫院病房的集群抽樣,因為可以將資源集中於較少的地點。最終,從一所英國大型教學醫院的18個病房中選取樣本。所有病房都位於同一家醫院,因此實質上構成一種便利抽樣。便利抽樣可見之前問題說明【2】。所有被邀請參加研究的住院成人吸菸者和最近戒菸者均被納入(a錯誤)。然而,並非所有受邀參加的病人都同意參加試驗。
試驗中使用集群抽樣法進行分配,即分配病房而非病人到介入組或對照組。病房隨機分配至治療組,並根據每週出院人數進行分層隨機分配。分層隨機分配已在問題中說明【3】。每個病房的所有病人接受相同的治療(介入或對照)。集群分配減少實際操作和組間干擾問題(b正確),而若使用簡單隨機分配,可能會出現這些問題。即,簡單隨機分配可能導致同一病房病人被分配至不同治療組,可能使工作人員在實施介入時面臨困難,並導致兩組病人交互影響。
研究中可以使用兩種主要的抽樣方法來招募參與者——隨機抽樣(有時稱為機率抽樣)和非隨機抽樣(有時稱為非機率抽樣)。隨機抽樣涉及對人群成員進行某種形式的隨機選取。簡單隨機抽樣(有時簡稱為隨機抽樣),如上文所述,是機率抽樣中最直接的類型。
根據定義,集群抽樣屬於機率抽樣(c正確)。如上所述,集群抽樣涉及從群體中隨機選取集群,並邀請每個被選中集群中之所有成員參加。因此,群體中每個成員有固定的選取機率,且與其他成員的選取無關。在本範例中,實際上這些病房是通過便利抽樣選擇的——研究者選擇這18個病房是因為它們都位於同一家醫院,且對研究者來說易於接觸。便利抽樣屬於非機率抽樣,因為所得樣本並非通過對母群體成員之隨機選取得到【2】。因此,上述研究中採用的集群抽樣方法可能更適合描述為非機率抽樣方法。特別是,並非母群體中所有的醫院病房都有被選中並納入樣本的機會。
集群抽樣通常作為多階集群抽樣的其中一個實施步驟,此種方法常簡稱為多階段抽樣【5】。多階段抽樣涉及基於群體內自然群聚之層次結構,分兩階或多階進行隨機抽樣。在每一階段中,會對不同類型的集群進行抽樣,而這些集群00在後續階段中是層層嵌套的。抽樣的最後一階段,則是從倒數第二階段選出的集群中隨機挑選參與者。
在本研究中使用的簡單集群抽樣並未被視為多階段抽樣,主要原因為研究中僅抽取一種集群(即病房)。此外,病房內的所有病人都被邀請參加研究。與多階段抽樣形成對比,後者在最後一階段會從選中的群聚中隨機招募參與者。
Reference:
[1] Murray RL, Leonardi-Bee J, Marsh J, Jayes L, Li J, Parrott S, et al. Systematic identification and treatment of smokers by hospital based cessation practitioners in a secondary care setting: cluster randomised controlled trial. BMJ 2013;347:f4004.
[2] Sedgwick P. Convenience sampling. BMJ 2013;347:f6304.
[3] Sedgwick P. Stratified random allocation. BMJ 2013;346:f822.
[4] Sedgwick P. Cluster randomised controlled trials. BMJ 2012;345:e4654.
[5] Sedgwick P. Stratified cluster sampling. BMJ 2013;347:f7016.
#匯東華 #醫學統計 #集群抽樣 #抽樣方法 #戒菸研究 #公共衛生 #流行病學
數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。
全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。
Fig1.同一個Project資料散落在不同tables,無法使用
Fig2.整併與清理為可分析的table
Fig.3整理和分析後形成有意義的知識
概念與流程示意圖
課程規劃核心為以「學習者」為中心進行「傳承」
以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。
開設線上統計學院
SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)
課程網址:https://medata.teaches.cc/
課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M
課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E
臨床研究思維-Open your mind
課程網址:https://medata.teaches.cc/
課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk
為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。