"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

BMJ小小統計問題(140):Analysing case-control studies: adjusting for confounding (分析病例對照研究:調整干擾因子)

Cite this as: BMJ 2012;345:e6178

https://www.bmj.com/content/345/bmj.e6178



                                             

前言

本期說的內容十分精采,不只是病例對照研究的設計、配對的概念、干擾因子的調整作法,更重要的是如何使用循序漸進的迴歸模型呈現證據力度的思維。相關課程請看,【eB02-小白的醫學統計必修課(上)】,講解醫學統計學核心概念進行系統性理解,專治統計不全症;以及,最實用的醫學實戰統計課程【eB02-小白的醫學統計必修課(下)】。另已於4/22將公告下半年度公司課程和工作坊的時間表,包括GPTs更多的應用、統計、研究及AI課程,歡迎訂閱公司google行事曆與關注官網最新消息或至本公司官方line洽詢。感謝眾多朋友兩年多來的一路陪伴,隨著匯東華三周年慶的到來,越發感謝。Hope u enjoy it

----

路徑:匯東華官網/學習專區/BMJ小小統計問題列表

 


-----

問題

一項病例對照研究檢視慢性幽門螺旋桿菌感染與年輕時期冠狀動脈心臟疾病間的關聯。總共招募了1122名疑似在30至49歲時急性心肌梗塞的存活者。對於每一個病例,都登記一個與年齡和性別配對且無冠狀動脈心臟疾病史之對照組。通過血清學證實幽門螺旋桿菌的慢性感染。收集包括吸菸行為、社會經濟地位指標、肥胖和血脂濃度在內的其他冠狀動脈心臟疾病風險因素的資訊。對照組被詢問他們當前的習慣和歷史,而病例組則被詢問他們在指標心肌梗塞發生前的習慣和歷史。從病例組在出現症狀後的24小時內取得血樣,並在收集完有關風險因素的資訊後從對照組取得血樣 [1]。
 
早發性心肌梗塞與幽門螺旋桿菌感染抗體陽性顯著相關(OR = 2.28(99%信賴區間1.8 - 2.9))。在調整吸菸和社會經濟狀態指標後,OR降至1.87(1.42 - 2.47),並在進一步調整血脂濃度和肥胖後,OR降至1.75(1.29 - 2.36)。因此,冠狀動脈心臟疾病與幽門螺旋桿菌感染陽性間存在中度關聯,此種關聯不能完全由其他風險因素解釋。

 

 

下列敘述何者正確?

a) 配對確保病例和對照組間的任何差異不是由於年齡和性別的差異所導致。

 b) 病例對照研究估計處於風險中的族群(population at risk)。

 c) 經調整的OR可能是使用logistic regression導出的。

 d) 幽門螺旋桿菌抗體陽性與冠狀動脈心臟疾病間的關聯與抽菸社會經濟狀態指標無關


 

 

答案

a、c和d正確,而b錯誤。

 

 

 

詳細說明

病例對照研究的目的是調查幽門螺旋桿菌抗體陽性是否是年輕時期急性心肌梗塞的潛在風險因素。根據疾病狀態選擇兩組病人:病例組,即疑似急性心肌梗塞的存活者,年齡在30至49歲之間;以及年齡和性別配對之健康對照組。比較病例組和對照組確定幽門螺旋桿菌抗體陽性是否在一組中比另一組更常見。若是如此,它將是年輕時期急性心肌梗塞的潛在風險因素。

 

在調查幽門螺旋桿菌抗體陽性與冠狀動脈心臟疾病間之關係時,存在干擾的可能性。任何干擾都可能導致虛假的統計關聯,甚至導致關係被忽略。若病例和對照組在人口特徵或影響幽門螺旋桿菌抗體陽性與年輕時期冠狀動脈心臟疾病關係之預後因子上存在差異,則會發生干擾。這些因素將包括收集數據的風險因素,如年齡、性別、吸菸行為、社會經濟狀態指標、肥胖和血脂濃度。

 

為了說明上述研究中干擾的現象,考慮抽菸狀態。抽菸與冠狀動脈心臟疾病的增加風險相關,也與幽門螺旋桿菌感染有關:抽菸者比非抽菸者更有可能感染幽門螺旋桿菌。若發現幽門螺旋桿菌感染在病例中比對照組更常見,可能難以確定冠狀動脈心臟疾病是與慢性幽門螺旋桿菌感染的增加頻率相關,還是與吸菸頻率的增加有關。因此,除非對吸菸的影響進行調整,否則它可能會干擾幽門螺旋桿菌感染和冠狀動脈心臟疾病間的任何關係。

 

在臨床試驗的背景下討論的干擾在之前已提及[2]。在上述研究中,通過兩種方式考慮干擾因子:在設計階段根據年齡和性別配對病例和對照組;以及在分析階段調整潛在的干擾因素。

 

配對是基於懷疑的干擾變數進行的,在本研究中是年齡和性別。根據年齡和性別配對病例和對照組意味著對於每一個招募的病例,都找一個相同年齡和性別的對照組。在上述研究中,根據年齡進行配對涉及找到一個其年齡在匹配病例的年齡範圍內五年的對照組。由於病例和對照組在年齡和性別上可比,他們在幽門螺旋桿菌抗體陽性方面的任何差異不可能是來自於年齡和性別的差異——亦即,由於年齡和性別差異導致的潛在干擾被最小化(a正確)。事前根據年齡和性別配對病例和對照組比在統計分析中調整與年齡和性別差異相關的潛在干擾更有效,如下所述。

 

從病例對照研究中無法估計風險族群(population at risk)(b錯誤)。估計風險族群已在之前說明[3]。這將涉及估計有和沒有風險因素(幽門螺旋桿菌抗體陽性)的族群中,會有多少比例在年輕時期發展成冠狀動脈心臟疾病。在上述研究中,參與者最初是根據他們的疾病狀態(病例或對照)以相等比例被識別。隨後,以回顧性方式收集有關冠狀動脈心臟疾病的潛在風險因素的資訊。在母群體中,病例和對照顯然不會以相等的比例存在。因此,無法以此估計風險族群,也無法獲得相對危險性(RR)來估計幽門螺旋桿菌抗體陽性與冠狀動脈心臟疾病之間的關係。相反地,會採用OR [4]。

 

第一,計算幽門螺旋桿菌抗體陽性與冠狀動脈心臟疾病關係的未調整的OR,有時被稱為粗OR,即未對干擾進行調整。隨後通過logistic regression對OR進行潛在干擾的調整(c正確)。調整干擾分為兩階段進行:首先,是對吸菸和社會經濟狀態指標進行調整;之後,再額外對血脂濃度和肥胖進行調整。這允許以逐步方式調查每組變量的干擾程度。通過同時調整或控制多個干擾因子,可以估計慢性幽門螺旋桿菌感染與冠狀動脈心臟疾病間的真實關係。調整混淆量化在假設具有相似吸菸和社會經濟狀態以及相同血脂濃度和肥胖程度的參與者間的關係。實際上,消除幽門螺旋桿菌抗體陽性與冠狀動脈心臟疾病關係中每個干擾變數的類別或數值間的任何差異。

 

研究人員提出OR之99%信賴區間而非標準95%信賴區間。因此,該研究的顯著性臨界水準被設定為1%。亦即,從統計學角度來看,幽門螺旋桿菌抗體陽性與冠狀動脈心臟疾病間的關係必須更強,才能被認為是顯著的——即,相關的P值必須小於0.01而不是典型的0.05。因為該研究是探索性的,將顯著性臨界水準設定為1%意味著發現顯著關係或發生類型I錯誤(當虛無假設為真時,卻拒絕它)的可能性較小。

 

若在對干擾因子進行調整後,風險因素與疾病間的關係仍然顯著,則稱為有獨立於被控制的潛在干擾變數之作用。在上述例子中,幽門螺旋桿菌抗體陽性與冠狀動脈心臟疾病關係的未調整OR為2.28(99%信賴區間1.8 - 2.9)。因為99%信賴區間不包含1,所以在1%的水準上OR是顯著的。在對吸菸和社會經濟狀態指標進行控制後,OR降至1.87(1.42 - 2.47)。因為在調整干擾後關係仍然顯著,所以它獨立於吸菸和社會經濟狀態(d正確)。然而,因為在控制干擾後OR降低,所以關係有部分由吸菸和社會經濟狀態所解釋。在對血脂濃度和肥胖進行額外調整後,OR進一步降至1.75(1.29 - 2.36)。因此,關係也部分由血脂濃度和肥胖解釋。然而,幽門螺旋桿菌感染與冠狀動脈心臟疾病間的關係仍然顯著,因此獨立於血脂濃度和肥胖。

 

當疾病或結果在母群中罕見(通常盛行率是少於10%)時,樣本OR是RR好的估計值。從完全調整後的OR可以估計,若存在幽門螺旋桿菌抗體陽性,相較於沒有感染,冠狀動脈心臟疾病的風險高出75%。

 

在本例中,僅報導幽門螺旋桿菌感染作為冠狀動脈心臟疾病的風險因素。其他變數作為潛在干擾因子進行調整,但其作為風險因素的效果未被報告。通常在病例對照研究中,會調查多於一個潛在風險因素的效果。Logistic regression模型同時探索疾病潛在風險因子的效果,通過研究中包含的所有其他變數調整干擾。在上述研究中,病例和對照組根據年齡和性別進行匹配。因此,由於這兩組在這些變數上相似,無法通過使用logistic regression來檢查它們作為風險因子或干擾因子之效果。雖然年齡和性別是冠狀動脈心臟疾病的風險因素,但在這項研究中並非關注的重點。病例和對照組通常不會在超過三個變數上進行配對,因為在更多變量上進行配對通常在尋找適合的對照組會變得困難。當在三個變數上進行配對時,如年齡、性別和種族,會需要大量的潛在對照組。

 

 

References:

[1] Danesh J, Youngman L, Clark S, Parish S, Peto R, Collins R for the International Studies of Infarct Survival (ISIS) Collaborative Group. Helicobacter pylori infection and early onset myocardial infarction: case-control and sibling pairs study. BMJ 1999;319:1157.

[2] Sedgwick P. Confounding in clinical trials. BMJ 2012;345:e7951.

[3] Sedgwick P. Estimating the population at risk. BMJ 2012;345:e6859.

[4] Sedgwick P. Odds ratios II. BMJ 2010;341:c4971.


#匯東華 #BMJ統計問題 #醫學統計 #病例對照研究 #配對 #干擾因子 #logistic regression

 


 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。