"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

BMJ小小統計問題(163):Bias in observational study designs: case-control studies(觀察性研究設計之偏差:病例對照研究)

 

Cite this as: BMJ 2015;350:h560

https://www.bmj.com/content/350/bmj.h560
醫學統計、ChatGPT做研究、ChatGPT寫論文、統計分析

前言

山陀兒颱風重創高雄,市容在政府相關單位努力下已逐漸恢復,公司也在著手規劃如何讓外在環境因素對運作的影響降至最低。當環境不確定性增加,越是考驗一家公司之緊急應變能力。自動化、AI化、持續與永續是今年第四季與2025年公司努力的目標。平安是福,一切歸於平安。本期文章探討#觀察性研究設計中的偏差(#Bias),特別是#病例對照研究(case-control study)中的選擇偏差(selection bias)、確認偏差(ascertainment bias)及回憶偏差(recall bias),識別與管理這些偏差能夠提升觀察性研究結果之準確性與可靠性。值得一讀。

另本人拙作”ChatGPT於系統性文獻回顧和統合分析之應用”於#台灣護理學會 發行之護理雜誌 2024年10月71卷 5期刊登,歡迎大家批評指教。往後會陸續發表本系列內容,也請大家持續關注。Hope u enjoy it!


10月份工作坊報名

10/18 (五) Live08:用別人的數據,做自己的研究:全科醫學公開資料庫介紹與應用,18:30~20:00,費用2000元,會員免費。

我們的目標:在AI大航海時代,善用AI工具,擺脫耗時費力的研究瑣事,專注於更有價值的事務上,持續進化!

更多學習資源:

想了解更多?

聯繫我們的官方LINE: @medatatw,感謝您一路相伴,讓我們一同在AI時代一起進化! ✨


 

問題:

研究者調查日曬暴露與多發性硬化症(Multiple Sclerosis, MS)風險間的關係。此為基於人群的病例對照研究(population-based case-control study)。參與者來自澳大利亞塔斯馬尼亞州,年齡均在60歲以下,且至少有一位祖父母出生於塔斯馬尼亞州。病例組包括自願參加的多發性硬化症患者,其參加當地多發性硬化症協會的資訊活動,或在醫護人員邀請下加入研究。總共有136位經臨床和磁共振影像(MRI)標準診斷為多發性硬化症的病人被納入病例組。

 

對於每個病例,隨機選取兩名符合性別和出生年份匹配的對照組參與者,來自當地的社區居民。總共招募359名符合條件的對照參與者,回應率為76%[1]。

 

研究使用一份經過驗證的問卷,記錄參與者16歲前在冬季和夏季週末及假期中通常暴露於陽光下的時間。並且,以皮膚表面日曬損傷(actinic damage)作為累積日曬暴露的標記。研究人員通過硅膠模型來測量手部皮膚損傷,並將損傷分級為1(皮膚未受損)至6(嚴重退化)。

 

研究者報告指出,在6至15歲期間,每天平均2到3小時以上的日曬暴露與多發性硬化症風險降低有關(校正後OR=0.31,95%信賴區間0.16至0.59)。皮膚損傷程度較高(損傷等級4-6)也與多發性硬化症風險降低相關(OR=0.32,95%信賴區間0.11至0.88)。結論指出,兒童和青少年早期更高的日曬暴露與多發性硬化症風險的降低有關。紫外線輻射不足可能會影響多發性硬化症的發展。

 

下列何項偏差可能影響上述病例對照研究及其結果?

a) 分配偏差(allocation bias)

b) 確認偏差(ascertainment bias)

c) 評估者偏差(assessor bias)

d) 干擾偏差(confounding)

e) 回憶偏差(recall bias)

f) 回應偏差(response bias)

g) 選擇偏差(selection bias)

  


答案:

b、c、d、e、f 和 g 皆正確,而 a錯誤。

 詳細說明:

該研究的目的是確定日曬暴露與多發性硬化症發展間關係,採用病例對照研究設計。研究基於參與者的健康狀況識別兩組人群——一組是診斷為多發性硬化症的患者(病例組),另一組為有此診斷的健康對照(對照組)。病例對照研究是一種回溯性設計,即回顧性地收集潛在風險因素的數據。本項研究通過問卷收集過去日曬暴露的資訊,並且使用皮膚損傷作為累積日曬暴露的標記。病例組和對照組進行比較,以確定是否某些特定風險因素在某一組中更為常見。為了避免不準確或不適當的比較,嚴格定義病例組與對照組之納入標準。

 

選擇偏差(g正確)是病例對照研究中常見的偏差。選擇偏差指的是所招募的病例或對照與他們所代表的人群(母群體)存在系統性差異。病例通常是通過便利抽樣(convenience sampling)招募,例如來自醫院門診的病人,這些群體較易於接觸。對照通常來自於其他無關疾病的門診病人。因此,病例和對照並非隨機抽樣於母群體,選擇偏差的風險很高。在本項研究中,病例和對照來自塔斯馬尼亞州的居民,目的是盡量減少選擇偏差。然而,並非所有邀請參與研究的病例和對照都參與研究,因此選擇偏差可能仍然存在。

 

確認偏差(b正確)是由於資料收集過程中的偏差所致,例如研究人員在確認參與者是否有多發性硬化症或在測量皮膚損傷時,可能因為對研究假設的了解而無意識地影響結果。此外,問卷中的日曬暴露訊息可能因參與者的記憶不準確而產生偏差,此為回憶偏差(e正確)。回憶偏差為病例和對照在回憶過去風險暴露時準確性存在系統性差異。例如,病例組可能認為日曬暴露與其病情有關,從而更精確地回憶他們的過去暴露。

 

回應偏差(f正確)可能出現在參與者回報過去行為時,與實際行為存在系統性差異。例如,因為日曬與皮膚癌的關係,可能會導致日曬較多的參與者低估他們的日曬時間。

 

由於病例對照研究設計的回溯性特徵,無法確定日曬暴露與多發性硬化症發生之間的因果關係,該研究可能受到干擾因素的影響(d正確)。例如,性別、年齡、種族、家族病史等均為多發性硬化症的潛在干擾因素。雖然研究設計已通過匹配性別和出生年份來減少性別和年齡的干擾效果,其他危險因素的影響可能仍然存在。

 

分配偏倚(a錯誤)不會出現在病例對照研究中,因為參與者是根據他們的健康狀況分配到病例組或對照組,而非隨機分配。

 

Reference

[1] Van der Mei IAF, Ponsonby A-L, Dwyer T, Blizzard L, Simmons R, Taylor BV, et al. Past exposure to sun, skin phenotype, and risk of multiple sclerosis: case-control study. BMJ 2003;327:316.

[2] Sedgwick P. Logistic regression. BMJ 2013;347:f4488.

 

#匯東華 #BMJ統計問題 #醫學統計 #觀察性研究 #病例對照研究 #偏差控制 #流行病學 #統計學應用 #醫學研究方法

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。