"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

A comparison of sampling error and standard error (抽樣誤差 vs. 標準誤差)

Cite this as: BMJ 2015;351:h3577

https://www.bmj.com/content/351/bmj.h3577.long
                                             

前言

本期BMJ小小統計問題說明抽樣誤差 (sampling error)與標準誤差(standard error)的概念,相信許多朋友都很耳熟,但不見得都知其意,本文將此兩者的概念解釋得很清楚,並提醒在使用95%信賴區間進行組別差異比較時,需要注意的地方。最近公司陸續推出幾門精采與實用的統計課程,正在招生中,期待您的參與。另於四月也將推出下半年度的統計、研究及AI課程,歡迎訂閱公司google行事曆與關注官網最新消息。若想針對醫學統計學核心概念進行系統性理解,強力推薦新上市課程【eB02-小白的醫學統計必修課(上)】,專治統計不全症。Hope u enjoy it

-----

路徑:匯東華官網/學習專區/BMJ小小統計問題

 


-----

✨本公司提供【流行病學】與【生物統計學】線上課程,請至匯東華統計學院

匯東華會員制


-----

問題

研究人員通過一項國家大腸癌篩檢計畫,調查飲食和體育鍛煉計畫對超重或肥胖人群體重的影響。該研究為一項多中心隨機對照試驗。介入措施包括為期 12 個月的個性化、以行為為重點的減肥計畫。對照組治療僅包括一份減肥手冊。參與者為超重或肥胖的成年人(50-74 歲),他們在糞便潛血試驗結果呈陽性後接受結腸鏡檢查,並經組織病理學檢查確診為腺瘤。共招募 329 名參與者隨機分配到介入組(163 人)或對照組(166 人)。[1]

 

主要結果是 12 個月內的體重變化。在追蹤過程中,介入組有 148 人(91%)、對照組有 157 人(95%)獲得主要結果資料。12 個月後,介入組的平均體重減輕了 3.50 千克(95% 信賴區間為 2.70 至 4.30;標準誤差為 0.40),而對照組的平均體重減輕 0.78 千克(0.19 至 1.38;標準誤差為 0.30)。介入組的體重減輕幅度明顯更大(平均差異為 2.69 千克,1.70 至 3.67;P<0.001)。結論是,在全國老年人結直腸癌篩檢計畫中啟動飲食和體育鍛煉介入,可以實現明顯的體重減輕,為降低病人風險提供巨大的潛力。

 

下列敘述何者正確?

a) 樣本估計容易出現抽樣誤差

b) 從母群體中抽取樣本會產生抽樣誤差

c) 治療組平均體重減輕的標準誤差可以衡量樣本平均值作為母群體參數估計值的準確性

d) 一般來說,如果樣本量增加,治療組的標準誤差也會增加。


 

答案

a、b 和 c 正確,d 錯誤。

 

 

 

詳細說明

該試驗旨在研究飲食和體育鍛煉介入對超重或肥胖族群體重的影響。該試驗是一項隨機對照試驗,從母群體中選取一組樣本。治療組的平均體重減輕量是對母群體參數的估計;亦即,若向母群體中的所有成員提供介入或對照治療,將達到的母群體平均體重減輕量。母群體參數是未知的。樣本估計值(有時稱為點估計值)用於推論介入與對照的效果。上述試驗中的樣本只是可以從母群體中選取的眾多樣本之一。來自抽樣的性質意味著每個樣本的發病率和人口特徵都會與其他樣本不同,任何樣本的特徵都不可能與母群體中的特徵相同。因此,根據樣本估計值對母群體參數進行推論會存在不確定性。統計的目的就是量化這些推論的不確定性。

 

在上述試驗中,治療組平均體重減輕的樣本估計值必須與母群體參數的大小相似。然而,由於抽樣的性質,它們不可能完全相同。因此,樣本估計值容易出現抽樣誤差(a正確)。一般來說,抽樣誤差是指樣本估計值與母群體參數間的大小差異。統計意義上的 "誤差 "一詞並不是指抽樣時出現錯誤。誤差指的是樣本平均值作為母群體參數的估計值的不準確性—此為獲取樣本對母群體進行推論的直接結果(b正確)。由於母群體參數是未知的,因此抽樣誤差是一個理論概念

 

每個治療組追蹤時體重變化的平均值是該治療組的母群體參數的估計值。抽樣誤差用平均值的標準誤差來量化。平均值的標準誤差(SEM,也簡稱為標準誤差(SE,用於衡量樣本平均值作為母群體參數(c正確)估計值的準確性。每個治療組的樣本估計值的標準誤差來自樣本資料;其計算方法為 12 個月時體重變化的標準差除以治療組參與者人數的平方根。一般來說,標準誤差越大,樣本平均值作為母群體參數的估計值就越不準確。而隨著樣本量的增加,標準誤差會減小(d錯誤)。因為隨著樣本量的增加會越接近母群體的樣本量,樣本估計值會變得更接近母群體參數值,從而成為更準確的估計值,抽樣誤差也將隨之減小。

 

治療組追蹤時平均體重變化的標準誤差本身用途有限。對於每個治療組,平均值的標準誤差用於得出追蹤時平均體重變化這一母群體參數的 95% 信賴區間。信賴區間為一個數值範圍,用於量化樣本平均值作為母群體參數估計值的不確定性。[2] 不過,在比較介入治療與對照治療時,較佳的作法為列出治療組間 12 個月平均體重變化差異的信賴區間,而並非比較各治療組平均體重變化的信賴區間,這樣更有參考價值。[3]

 

追蹤時不同治療組平均體重變化差異的母群體參數的 95% 信賴區間由差異的標準誤差得出。儘管沒有列出,但差異標準誤差的計算方法與治療組標準誤差的計算方法類似。要得出治療組平均值差異的標準誤差,需要將每個治療組的樣本變異數除以樣本量;然後將得出的數值相加,該數值的平方根等於樣本平均值差異的標準誤差。治療組平均值差異的標準誤差與治療組的標準誤差具有相似的性質。 [Showme說明:本段為公式講解,可跳過]

 

標準誤差和抽樣誤差經常被混淆。可能是因為這兩個術語間的相似性,都包含 "誤差 "一詞。抽樣誤差是一個理論概念,由標準誤差量化。平均值的標準誤差和標準差也經常被混淆。之前的問題中已進行說明[4],標準差並不能衡量抽樣誤差,而是量化樣本中變數測量值的變異性(variation)。

 

 

Reference:

[1] Anderson AS, Craigie AM, Caswell S, et al. The impact of a bodyweight and physical activity intervention (BeWEL) initiated through a national colorectal cancer screening programme: randomised controlled trial. BMJ 2014;348:g1823.

[2] Sedgwick P. Understanding confidence intervals. BMJ 2014;349:g6051.

[3] Sedgwick P. Randomised controlled trials: inferring significance of treatment effects based on confidence intervals. BMJ 2014;349:g5196.

[4] Sedgwick P. Standard deviation or the standard error of the mean. BMJ 2015;350:h831.

 

#匯東華 #BMJ統計問題 #抽樣誤差(sampling error) #醫學統計 #標準誤(standard error)


 


 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。