"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

 BMJ小小統計問題(70):

Meta-analyses: tests of heterogeneity

(統合分析:異質性檢定)

                                 

前言:

Christmas and happy new year. ❄❄❄

Wishing you a beautiful holiday season filled with joy and laughter.

     

BY 匯東華統計顧問有限公司

                           

題目:          

研究人員調查食用白米與2型糖尿病間之關係。他們對前瞻性世代研究進行一項統合分析(meta-analysis)。這些研究報告食用白米導致2型糖尿病的相對危險性(RR,高v低)。共選擇4篇論文,包括在亞洲和西方人群中進行的7項不同的前瞻性世代分析。在352,384名追蹤4 ~ 22年的參與者中,共有13,284例新發2型糖尿病。

 

每項研究中,研究人員均確定白米攝取量高與攝取量低相比之2型糖尿病RR。對7個樣本估計值進行異質性檢驗(Cochran 's Q檢驗,P=0.001;I2 = 72.2%)。總效果量為1.27(95%信賴區間1.04 ~ 1.54)。研究人員得出結論,白米攝取量較高與患2型糖尿病的風險會顯著較高。

          

下列針對異質性之統計檢定敘述何者正確?

a)虛無假設:作為母群體參數估計值之樣本RR間存在異質性。

b)母群體RR的7個樣本估計值間存在統計學異質性。

c)隨機效果模型適用於母群體RR的計算。

 

答案:

bc正確,a錯誤。

                   

詳細說明:

  統合分析合併白米攝取量高與低相比,2型糖尿病相對風險性的7個樣本估計值之母群體參數。2型糖尿病母群體RR的總效果量估計值比任何個體樣本估計值更精確。如下圖所示為統合分析之森林圖。總體RR為1.27(1.04 ~ 1.54),在圖的底部顯示為“總體:I2=72.2%,P=0.001”。森林圖顯示每項研究中白米攝取量的高低組別。

  

  統合分析必須納入異質性的統計學檢定,以評估7個樣本估計值間之變異程度。如果樣本相對危險性大小相似,並且從同一母群體中抽取而得,則樣本間的差異在期望值內,即樣本間的差異極小,那麼就存在統計學同質性。若不存在統計學同質性,則存在統計學異質性,樣本估計值將有顯著差異。由於各種原因,樣本估計值間可能會出現差異。母群體可能在子群間(如,不同種族)的大小不同。異質性統計檢定結果會影響總效果量的計算。 

   

  異質性的傳統統計學檢定採用Cochran 's Q檢定。檢定的執行與傳統之統計假設檢定相似,存在一個虛無假設和一個對立假設。假設檢定始於統計同質性成立(Showme說明:即檢定虛無假設:組間具有同質性)。以本例而言,虛無假設認為母群體參數之樣本估計值間存在同質性(a錯誤);任何存在的差異都是由於從同一母群體中抽取樣本的差異所造成(Showme說明:即抽樣誤差),或者可能是研究方法上的細微差異所造成。對立假設則顯示樣本估計值間存在異質性。 

  

  Cochran's Q檢定的P值為0.001。因此,在5%的臨界顯著性水準上,虛無假設被拒絕,而支持對立假設。得出的結論為,樣本估計值間存在統計異質性(b正確)。Cochran 's Q檢定的P值顯示於森林圖中標題為“總體:I2=72.2%,P=0.001”。 

   

  Cochran 's Q檢定對檢測樣本估計值間異質性可能不完全準確,因此,Higgins I2統計量也經常被使用。此一統計量表示樣本估計值間由於異質性而產生的變異百分比,數值範圍從0%~100%,0%表示不存在統計異質性。若I2為50%或以上,通常被認為存在顯著異質性。在森林圖中總效果量之I2顯示為標題:“總體:I2=72.2%,P=0.001”,證實由Cochran Q檢定結果存在統計異質性的推論(b正確)。 

   

  由於存在統計異質性,因此採用隨機效果meta-analysis(c正確)。若統計異質性不存在(即統計同質性存在),則會採用固定效果模式。兩方式用於計算總效果量的方法不同。存在異質性時,隨機效果模式相較於固定效果模式之總效果量會有更寬的信賴區間,導致總效果不太準確。雖然隨機效果法在計算總效果量估計值時考慮異質性的存在,但七個樣本估計值是否應該組合成一單一的總效果是值得懷疑的。異質性的存在表明,食用白米與2型糖尿病間的關係可能在母群體的子群間存在差異。這些研究被分為兩個子群——亞洲人和西方人——目的是確定這些子群內樣本估計值間是否存在同質性(圖)。據報導,西方和亞洲人種在攝取白米與罹患2型糖尿病風險間的關係存在差異。亞洲人(RR為1.55,1.20-2.01)之相關性強過西方人(1.12,0.94-1.33)。研究人員得出結論,兩個子群之樣本估計不存在異質性。Cochran's Q檢定對兩子群均無統計學意義(P值分別為0.127和0.172)。對於西方人,Higgin 's I2統計值為40.0%,而對於亞洲人,它表明弱異質性存在(I2=51.6%)。雖然兩個子群內均具有統計同質性是合理的假設,但我們仍然採用隨機效果模型執行分析。在同質性成立的情況下,隨機效果模型與固定效果模型具有相同的小計(subtotal)估計及95%信賴區間。 

       

Reference:

[1]Hu EA, Pan A Malik V, Sun Q. White rice consumption and risk of type 2 diabetes: meta-analysis and systematic review. BMJ 2012;344:e1454 

                  

Cite this as: BMJ 2012;344:e3971 

https://www.bmj.com/content/344/bmj.e3971  

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。