"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

 BMJ小小統計問題(50)                                                    前言:

本期要談的是Logistic regression,說明它的適用情形與分析結果的解釋。Logistic regression是我們常用的一種迴歸分析,指標為OR(勝算比),與RR的解釋並不相同,需要注意;另外,將未調整與調整後的OR一起呈現有何好處呢?邁入第50期了!因為喜歡,所以分享,不知不覺就第50期了。Hope u enjoy it.
  
題目:
  研究者調查乳房保留手術術後再手術是否與患者特質有關。採用世代研究設計。參與者是在2005年4月1日至2008年3月31日期間156個英國NHS信託機構中接受原發性乳房保留手術的55297名女性。主要結果是手術後三個月內至少再手術一次。在3年的研究期間,11032例(20.0%,95%信賴區間19.6% - 20.3%)女性至少再手術一次[1]。
  Logistic迴歸分析再手術與患者特質(入院時的年齡、腫瘤類型、共病和社會經濟剝奪)間的關係(下表)。腫瘤類型根據在手術時記錄是否有原位癌(carcinoma)成分。研究人員評論說,當腫瘤有原位癌成分時,再手術的可能性幾乎是兩倍。
  
下列敘述何者正確?
a) logistic regression的結果變數是連續的
b)50-59歲乳房再手術的勝算比為1.0
c)可以得出腫瘤類型與乳房再手術具有獨立相關的結論
d)使用條件式logistic迴歸(Conditional logistic regression)得到調整後的勝算比
  
答案
c正確,而a, b和d錯誤。
   
   
詳細說明:
  本研究目的為探討是否可以根據患者的特質預測乳房保留手術術後3個月內的再手術。採用邏輯式迴歸模型(logistic regression model)。研究個案為55297名在三年內接受乳房保留手術的女性,其中11032人(20.0%)至少再手術一次[1]。
  
  邏輯式迴歸與前面提過的其他迴歸方法類似[2-3]。被稱為多變數分析(multivariable analysis),邏輯式迴歸探討一個依變數(Y)和一個或同時多個預測變數間的關聯性。相較於簡單線性與複線性迴歸的結果是連續性的,logistic regression之結局變數為二分類(a錯誤)。預測變數有時被稱為解釋變數,可以是連續變數、二分類變數或分類變數的任意混合。在本例中,解釋變數均為分類的,包括腫瘤類型(有無原位癌成分)、年齡別、社會經濟剝奪指數組別和有無共病。前提假設觀為每筆觀察結是互相獨立的,亦即,每名婦女在因變數和解釋變數只有一筆資料。
  
  邏輯式迴歸估計所給定預測值的結局發生率。通常,邏輯式迴歸的結果以勝算比呈現[4]。對於上述例子,我們給出了描述乳房再手術結局變數與各類別解釋變數間關係的未調整和調整勝算比(表)。未調整勝算比,又被稱為粗勝算比(Crude OR)指沒有調整其他可能的干擾變數。調整後的勝算比則有進行調整;實際上,它們表示在所有其他解釋變數都是常數時,結果和該解釋變數間的關係。
  
  年齡50-59歲的數字1並不代表OR值(b錯誤)。每個解釋變數都有一個參考組別,如OR中的數字1所示。有時以(1)代替。將變數的其他組別與參考組別進行比較,即得出OR值。某一特定組別的OR是該組別的再手術勝算除以參考組別的再手術勝算。例如,年齡小於40歲組的未調整OR=1.07。因此,40歲以下女性未調整的乳房再手術勝算是參考組別(50-59歲女性)的1.07倍。
  
  未調整和調整的OR的比較顯示干擾的程度。調整干擾後,小於40歲的年齡組和社會經濟剝奪指數4的OR變得顯著,而社會經濟剝奪指數5和有1個共病的OR變得不顯著。因此,這些類別的解釋變數與乳房再手術的結果變數間的關係可能存在干擾。然而,未調整和調整的勝算比數值差異很小,指出干擾的程度是小的。
  
  對於每個OR給出了母群體OR的95%信賴區間,提供了母群體參數的區間估計。若母群體優勢比的95%信賴區間排除了”1”,解釋變數類別間的無差異的統計虛無假設將被拒絕,而選擇對立假設,在5%顯著水準下[5]。
  
  如果解釋變數與結果之間的關係在調整干擾後顯著,則稱其與結果具有獨立相關性。在調整其他解釋變數後,腫瘤類型與乳房再手術具有統計學上的相關,母群體OR的95%信賴區間沒跨過”1”。因此,腫瘤類型被認為與乳房再手術具有獨立相關(c正確)。
  
  上述分析並非是條件邏輯式迴歸(d錯誤)。條件邏輯式迴歸是配對樣本在使用的如配對的病例對照研究。在此研究設計中,對於每個病例(經歷過主要結局的研究參與者),都有一個或多個對照(那些沒有經歷過主要結局的人),這些對照與病例使用年齡和性別等一系列變數進行配對。配對變數的潛在干擾效應可以在研究設計階段通過配對病例和對照來更有效地控制,而不是在之後的統計分析中。
  
Reference:
[1] Jeevan R, Cromwell DA, Trivella M, Lawrence G, Kearins O, Pereira J, et al. Reoperation rates after breast conserving surgery for breast cancer among women in England: retrospective study of hospital episode statistics. BMJ 2012;345:e4505.
[2] Sedgwick P. Simple linear regression. BMJ 2013;346:f2340.
[3] Sedgwick P. Multiple regression. BMJ 2013;347:f4373.
[4] Sedgwick P, Marston L. Odds ratios. BMJ 2010;341:c4414.
[5] Sedgwick P. Confidence intervals and statistical significance: rules of thumb. BMJ 2012;345:e4960.
[6] Sedgwick P. Why match in case-control studies. BMJ 2012;344:e691.

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。