"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

BMJ小小統計問題(118):Skewed distributions (偏態分布)

Cite this as: BMJ 2012;345:e7534

https://www.bmj.com/content/345/bmj.e7534

                                                   

前言

近日公司業務繁忙,藥廠的專案與公司內部制度和系統規畫陸續開展,本期小小統計問題就晚了一些。這期在說明偏態分布的定義以及所使用的無母數分析法。過去有幾期也有介紹過相關概念,建議一併觀看,學習效果更佳!Hope u enjoy it

-----

路徑:匯東華官網/學習專區/BMJ小小統計問題

匯東華課程

「12/2(六):AI01-探索ChatGPT、AI02-活用ChatGPT」招生中!

「12/3(日):AI03-Step by Step ChatGPT高效醫學論文寫作」招生中!

⭐線上課程:eAI02:Step by Step ChatGPT高效醫學論文寫作:關聯性研究[限時優惠37折off,至11/30日止!]

✨本公司提供【流行病學】與【生物統計學】線上課程,請至匯東華統計學院

匯東華會員制

課程介紹與報名資訊

新增聯絡手機:0911-197-101

-----

#第80題:Standard deviation versus standard error (標準差和標準誤)

#第115題:Independent samples t test (獨立樣本t檢定)

#第64題:Parametric v non-parametric statistical tests (母數 v 無母數統計檢定)

#第91題:Non-parametric statistical tests for independent groups: numerical data (獨立樣本之無母數分析:數值資料)

#第66題:Log transformation of data (資料之對數轉換)


問題

本研究採用隨機對照試驗研究設計,對不明原因急性腹痛病人早期腹盆腔電腦斷層掃描的療效進行評估。電腦斷層掃描在入院後 24 小時內進行。對照治療為標準做法(根據指示進行放射檢查)。共有 55 名病人,被隨機分配接受早期電腦斷層掃描,另55 名病人則接受對照治療。早期電腦斷層掃描治療組的平均住院時間為 6.6 天(標準差為 5.8 天),標準治療組為 9.2 天(9.8 天)[1]。

 

a) 介入治療組的住院時間分佈向右偏態

b) 介入治療組的住院時間樣本平均值小於樣本中位數

c) 治療組的住院時間將使用獨立樣本 t 檢驗進行比較


     

    答案

    a正確, b 和 c 錯誤。

     


    詳細說明

    住院時間此一結局指標的樣本測量值分布可用樣本平均值與標準差來描述[2]。約 68% 或更多的住院時間觀察值與樣本平均值的距離不會超過一個標準差。此外,約 95% 或更多的觀察值與樣本平均數的距離不會超過兩個標準差,約 99% 或更多的觀察值與樣本平均值的距離不會超過三個標準差。無論住院時間樣本測量值的分布形狀如何,是常態分佈或是偏態分布,都能得到上述推論。介入組的住院時間為 6.6 天,樣本標準差為 5.8 天。因此,約 68% 或更多的介入組病人之住院時間會介於(6.6-5.8)和(6.6+5.8)天之間,即介於 0.8 天和 12.4 天之間。約 95% 或更多的介入組病人的住院時間將介於(6.6-2(5.8))和(6.6+2(5.8))天之間,即介於-5.0 天和 18.2 天之間。此外,約 99% 或更多的介入組病人的住院時間將介於(6.6-3(5.8))和(6.6+3(5.8))天之間,即介於-10.8 天和 24 天之間。

     

    由於住院時間不能為負數,因此得出的範圍中有兩個數值是不可能的。因此,約 95% 或更多的介入組病人之住院時間介於 0 到 18.2 天之間,約 99% 的介入組病人的住院時間介於 0 到 24 天之間。由於樣本平均值小於範圍的中位數,因此住院時間的分布呈正偏態(a 正確)。雖然沒有顯示,但住院時間分布的長條圖會有一個向右的長尾,其中包含一些較大的值,但大部分觀察值集中在左側但高於零。從匯總統計中可發現,分布呈正偏態,特別是樣本平均值小於樣本標準差的兩倍。在對照組治療中,可以發現住院時間的分布呈正偏態,因為樣本標準差的值大於樣本平均值。由於住院時間呈正偏態,分布右側尾部的少數高值會不成比例地提高算術平均值。因此,兩個治療組的樣本平均值都將大於中位數(b 錯誤);依據報導,兩治療組的住院時間中位數都是 5 天。

     

    負偏態和正偏態分部已於前一問題介紹過[3]。負偏態分布的左側尾部包含一些低分,且比右側尾部長。在負偏態分布中,大部分分數集中在分布的右側。獨立樣本 t 檢定(有時也稱為Student’s t test)是比較兩個獨立組別間連續測量變數的平均值[4]。它是一種母數檢定,在進行檢定時,需要對資料做出假設[5]。為了進行這種檢定,需要假設要比較的變數在兩組中均為常態分布。因此,本例不能用獨立樣本 t 檢定來比較治療組(c錯誤)。

     

    可以進行無母數檢定,無須假設資料的分布。可以使用 Wilcoxon rank sum test或Mann-Whitney U test [6]。本試驗使用Mann-Whitney U test對治療組進行比較,P=0.20,表明治療組在住院時間上沒有顯著差異。另外,也可以按照之前的問題7 所述,對住院時間進行對數變換。以確定轉換後的資料是否符合獨立樣本 t 檢定之假設。

     

    Reference:

    [1]Ng CS, Watson CJE, Palmer CR, See TC, Beharry NA, Housden BA, Bradley JA, Dixon AK. Evaluation of early abdominopelvic computed tomography in patients with acute abdominal pain of unknown cause: prospective randomised study. BMJ 2002;325:1387.

    [2]Sedgwick P. Standard deviation versus standard error. BMJ 2011;343:d8010.

    [3]Sedgwick P. Skewed distributions. BMJ 2010;341:c6276.

    [4]Sedgwick P. Independent samples t test. BMJ 2010;340:c2673.

    [5]Sedgwick P. Parametric v non-parametric statistical tests. BMJ 2012;344:e1753.

    [6]Sedgwick P. Non-parametric statistical tests for independent groups: numerical data. BMJ 2012;344:e3354.

    [7]Sedgwick P. Log transformation of data. BMJ 2012;345:e6727.

    #匯東華 #BMJ統計問題 #Skewed distributions #Mann-Whitney U test




     

     數據串接與清洗

    數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

    全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




    Fig1.同一個Project資料散落在不同tables,無法使用




    Fig2.整併與清理為可分析的table




    Fig.3整理和分析後形成有意義的知識


    概念與流程示意圖

     教育培訓

    課程規劃核心為以「學習者」為中心進行「傳承」

    以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

     

    開設線上統計學院

    https://medata.teaches.cc/

    SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

    課程網址:https://medata.teaches.cc/

    課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

    課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

     

    臨床研究思維-Open your mind

    課程網址:https://medata.teaches.cc/

    課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
    課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

    臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

     計畫撰寫與統計諮詢





    為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。