"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

 BMJ小小統計問題(85):

The normal distribution (常態分佈)

Cite this as: BMJ 2012;345:e6533

https://www.bmj.com/content/345/bmj.e6533

                                 

前言:

本期為normal distribution。常態分佈作為統計學的基石,儘管基本,卻是母數分析(parametric analysis,#第64題),如t test (#第29題)、ANOVA (#第32題)、Pearson’s correlation (#第33題)、線性迴歸 (#第35題#第38題)等方法之理論分佈,為理解及應用這些複雜統計方法的基礎和框架。在使用母數分析檢定法時,若資料型態不符合常態分佈,可能會產生不正確的結果跟誤導性的結論。基礎,基石也,底盤打得穩,之後才能蓋得高。

 

在SPSS中,下列方法可以檢定資料是否符合常態分佈:

1.描述性統計:觀察資料的偏態和峰態,判斷其是否接近常態分佈。

2.繪製直方圖:檢視資料的分佈形狀,評估是否呈現鐘形分佈。

3.檢視Q-Q圖:檢查實際資料點是否貼合對角線,若是,則認為資料符合常態分佈。

5.常態分佈檢定:如Kolmogorov-Smirnov test或Shapiro-Wilk test。可從結果判定資料是否顯著偏離常態分佈。

此外,偏態分佈的左偏或右偏,主要以分佈的尾巴位於哪哪邊,左邊,即為左偏態(負偏態,有極小值);右邊,即為右偏態(正偏態,有極大值)。

 

最近業務繁忙,加上多門課程都在推動,四、五月份的實體統計分析課程即將開始,歡迎報名。另外,流行病學總複習需要再進行編輯,預計下周上市。謝謝各位朋友與學員的支持!Hope u enjoy it

 

A02-SPSS存活分析統計課程,2023/04/15()4/29()。報名截止日期:4/10()4/24()

課程介紹

WS3-SPSS醫學研究統計工作坊:配對研究設計與分析

課程介紹

課程報名

線上課程:流行病學總複習                          

問題

研究人員調查由一般科醫師開立抗抑鬱藥物處方以及轉診到憂鬱症專科診所是否與病人在治療開始時測量的憂鬱症嚴重程度量表得分有關。對38家38家一般科診所的病人進行匿名調查。使用9項病人健康問卷(PHQ-9)調查1658例病人, 使用醫院焦慮憂鬱量表(HADS)中的憂鬱子量表調查548例病人 [1]。

 

樣本HADS問卷分數的分佈近似常態,而PHQ-9分數呈負偏態。PHQ-9平均為15.5(標準差6.0),HADS平均評分為11.1(4.6)。憂鬱症嚴重程度評分較高的病人更有可能接受抗憂鬱藥處方,並被轉介到專科服務。然而,其他因素與治療和轉診有關,包括病人年齡和生理的共病以及地理區域。

 

下列敘述何者正確?

a) HADS分數近似常態分佈可用樣本平均值和標準差進行描述

b) HADS分數近似的常態分佈意指對稱於樣本平均值

c) PHQ-9分數分佈右側尾部較左側尾部長

d)樣本PHQ-9得分的平均值小於PHQ-9得分的中位數

 

答案

a,b,d正確,c錯誤。

 

詳細說明

圖1顯示上述研究中HADS和PHQ-9問卷得分的分佈情況。樣本HADS問卷得分近似常態分佈。常態分佈為一機率分佈,用來描述每個樣本估計分數在母群體中發生的機率。

 

圖2顯示病人HADS問卷得分近似常態分佈。它類似於圖1中在長條圖每個柱狀圖頂部畫一條平滑線所得到的曲線。此常態分佈用其平均值和標準差來描述本例病人的HADS問卷得分之平均值和標準差(a正確)。平均值描述樣本HADS問卷的平均分數,而標準差描述樣本均值之分數分佈。常態分佈,也稱為高斯分佈,呈鐘形,且左右對稱於平均值(b正確)。因為得分呈現對稱分佈,中位數等於平均值。

常態分佈通常是通過參考包含大多數觀測值的中心駝峰,加上分佈的尾部或極端值進行描述。樣本HADS問卷得分的標準差愈大,常態分佈的駝峰就會變扁平,分佈尾部的得分就愈多。分數標準差愈小,位於分佈極端值的病人愈少,中部駝峰的分數比例愈大,其高度也愈高。

 常態分佈

PHQ-9問卷得分的分佈(圖1)的平均值不對稱,被稱為偏態。分佈左側的尾部包含較低的分數,並且比右側的尾部更長(c錯誤)。大部份分數集中在分佈的右側。PHQ-9問卷分數的分佈被稱為負偏態或左偏態。相反地,若分佈有一個向右的長尾,大量的觀察集中在左邊,則分佈就會是正偏態或右偏態。偏態分佈的名稱是由較長尾部的一側決定——若左側尾部較長,則為負偏態或左偏態,若右側尾部較長,則為正偏態或右偏態。

 

PHQ-9問卷得分分佈為左偏態,因此中位數得分與平均值不相等。PHQ-9中位數得分不受分佈左尾極端值的影響。根據中位數定義,一半病人的評分低於中位數評分,一半病人的評分高於中位數評分。但是,這些低分會降低平均值。因此,由於PHQ-9問卷得分分佈呈負偏態,故平均值小於中位數(d正確)。反 ,若分佈呈正偏態(右偏態),則平均值會大於中位數。

 

許多物理、生物和社會變數都是正偏態,每個分佈都有唯一的平均值和標準差。正偏態分佈在統計推論中具有重要作用。許多統計檢定依賴常態分佈的特性,包括問題[2-3]中描述的student t test [2]( #29題)和ANOVA [3](# 32題)這些母數檢定[4](#64題)。一些統計程序,包括Pearson相關係數[5](#33題),也依賴於常態分佈的特性。

 

Reference:

[1] Kendrick T, Dowrick C, McBride A, Howe A, Clarke P, Maisey S, et al. Management of depression in UK general practice in relation to scores on depression severity questionnaires: analysis of medical record data. BMJ 2009;338:b750.

[2] Sedgwick P. Independent samples t test. BMJ 2010;340:c2673.

[3] Sedgwick P. One way analysis of variance. BMJ 2012;344:e2427.

[4] Sedgwick P. Parametric v non-parametric statistical tests. BMJ 2012;344:e1753.

[5] Sedgwick P. Pearson’s correlation coefficient. BMJ 2012;345:e4483.

 

#BMJ #醫學統計 #Endgames #Normal distribution #parametric statistics #student’s t test #ANOVA #Pearson’s correlation #Linear regression #匯東華

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。