"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

 BMJ小小統計問題(64):

Parametric v non-parametric statistical tests (母數 v 無母數統計檢定)

               

前言:

本期的統計問題要來回答母數與無母數統計檢定的異同之處,以及使用的前提假設。母數分析法需要分析變數符合常態性和變異數同質性假設,無母數分析則不用。無母數分析法使用門檻較低,但母數分析法所得結果比較有力。兩者各有其優缺點。Hope u enjoy it .

 

另外,強應用系列課程「A03-SPSS實戰課程-配對設計與分析」已在匯東華統計學院上架。本課程著重在配對設計及分析,重點在於傾向分數配對的介紹、操作及結果講解。有興趣的朋友歡迎至匯東華統計學院觀看課程介紹。 

     

題目:

研究人員通過比較左心室功能受損患者(n=359)和功能保留患者(n=163)[1],採用前瞻性世代研究追蹤慢性心衰竭患者5年死亡率。若患者有穩定的症狀性慢性心衰竭至少三個月,則納入研究。

 

收案時測量患者特徵包括年齡和心率。功能保留患者與功能受損患者年齡相近(62.5(標準差10.7) v 62.3(9.10)歲;獨立樣本t test: P=0.80)。功能完好的患者心率中位數較低(69(四分位差63-82) v 76(66-89)次/分; Mann-Whitney U test P<0.001)。左心室收縮功能受損患者的5年死亡率明顯更高(41.5% v 25.2%; P < 0.001)。 

    

下列敘述何者正確? 

a)獨立樣本t  test為母數檢定。 

b)使用獨立樣本t test需假設母群體中各患者組的年齡呈常態分佈。 

c) Mann-Whitney test是無母數分析檢定。

d)使用Mann-Whitney test需假設母群體中患者組間心率變異數相等。

   

答案:

a、b、c正確,而d錯誤。

   

     

詳細說明: 

  當進行資料分析時,有兩類統計方法可以選擇:母數分析 或 無母數分析。無母數分析也被稱為無分佈(distribution-free)法或列序(rank order)法。母數分析方法須對資料的分佈進行假設,而無母數分析方法則不作任何假設。 

    

  獨立樣本t test,又稱student t test,為一母數分析法(a正確),用於比較在兩個獨立組間的連續尺度測量變數之平均數[2]。比較兩組患者的平均年齡。虛無假設表明,在母群體中,功能保留和受損的患者組的平均年齡相等。該母群體為所有符合進入研究標準的慢性心力衰竭患者。母數分析法假設所分析的變數在母群體中具有特定的分佈,通常是常態分佈。 

    

  常態分佈是一個用平均值和標準差描述的理論分佈[3]。使用獨立樣本t test需假設每組的年齡在母群體中的分佈為常態分佈(b正確)。當使用獨立樣本t test時,進一步的假設為母群體中每組之年齡變異數相等(Showme說明:就是統計課本經常說的變異數要具有同質性,Homogeneity of Variance)。 

   

  在使用獨立樣本t test前,需要樣本資料的母群體估計值來驗證上述假設。可以通過檢查每組患者的年齡直方圖驗證是否呈現常態分佈假設。組間年齡變異數的相等性可以通過統計檢定來驗證,如統計軟體例行會提供的Levene’s test。 

   

  若樣本資料的分佈呈偏態,可以使用數值變換——如對數變換 (a logarithmic transform)——可能使資料適合使用母數方法進行分析。若兩組間的變異數不相等,則統計軟體通常會在應用獨立樣本t test時做出調整。當樣本量較小時,獨立樣本t test所需的假設尤其重要。一般認為每組的樣本量小於30時,如果假設不能被驗證,就應該使用無母數方法。 

   

  心率分佈的常態性和變異數同質性的假設不成立,因此不能採用獨立樣本t test。取而代之的是Mann-Whitney U test——對應於獨立樣本t test的無母數分析(c為真)。無母數分析法不假設資料在母群體中的分佈或組間變異數的同質性(d錯誤)。當使用Mann-Whitney U test時,虛無假設為,母群體中兩組的心率分佈相似——亦即,母群體中兩組的中位數心率是相等的。Mann-Whitney U test是基於對兩組個案之心率值進行排序。在虛無假設下,若母群體中每一組的心率分佈相近,則樣本中兩組的心率值之平均排序應為相等。Wilcoxon rank sum test有時用來代替Mann-Whitney U test;這兩檢定法是對等的,P值相同,因此在統計假設檢定時可以得出相同的結論。 

   

  應用母數分析法可以產生強而有力的觀點,有建議指出,母數分析法應只用於分析在連續尺度測量的資料。在序位尺度測量的變數,如憂鬱等級,在每個潛在值之間有很大差異,但通常使用母數法進行分析。在數值範圍有限的序位尺度測量的變數應使用無母數方法進行分析。然而,在使用無母數方法前,並無關於所需值範圍的規則。

  

下期預告: 

#BMJ小小統計問題(65):A comparison of parametric and non-parametric statistical tests 

#BMJ小小統計問題(66):Log transformation of data 

   

Reference:

[1] MacCarthy PA, Kearney MT, Nolan J, Lee AJ, Prescott RJ, Shah AM, et al. Prognosis in heart failure with preserved left ventricular systolic function: prospective cohort study. BMJ 2003;327:78-9. 

[2] Sedgwick P. Independent samples t test. BMJ 2010;340:c2673. 

[3] Sedgwick P. The Normal distribution. BMJ 2010;341:c6085. 

    

Cite this as: BMJ 2012;344:e1753 

https://www.bmj.com/content/344/bmj.e1753 

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。