"匯東華-認真作好每件事"
~統計，不再是阻力，而是助力~

A comparison of sampling error and standard error (抽樣誤差 vs. 標準誤差)

Cite this as: BMJ 2015;351:h3577

https://www.bmj.com/content/351/bmj.h3577.long

前言

本期BMJ小小統計問題說明抽樣誤差（sampling error）與標準誤差（standard error）的概念，相信許多朋友都很耳熟，但不見得都知其意，本文將此兩者的概念解釋得很清楚，並提醒在使用95%信賴區間進行組別差異比較時，需要注意的地方。最近公司陸續推出幾門精采與實用的統計課程，正在招生中，期待您的參與。另於四月也將推出下半年度的統計、研究及AI課程，歡迎訂閱公司google行事曆與關注官網最新消息。若想針對醫學統計學核心概念進行系統性理解，強力推薦新上市課程【eB02-小白的醫學統計必修課(上)】，專治統計不全症。Hope u enjoy it

-----

路徑：匯東華官網/學習專區/BMJ小小統計問題

2024年三~四月課程課程介紹與報名
✅線上課程：白話效果量（effect size）：概念、分析與應用✅
✅[線上課程]：小白的醫學統計必修課(上)，限時優惠10%
✅[線上課程]：3/29(五)小白的醫學統計必修課(下)
✅3/16 (六)[額滿]－實體課程：ChatGPT於科學研究之應用
✅3/17 (日)[額滿]－實體課程：AI02-ChatGPT高效醫學論文寫作
✅4/13 (六)[確定開班]－實體課程：A01-SPSS實戰課程：零基礎入門統計課程 [確定開班]
✅4/14 (日)[確定開班]－實體課程：A05-SPSS統計實戰班：問卷與量表統計分析
✅[實體]4/13(六)A01-SPSS實戰課程：零基礎入門統計課程 [確定開班] ☑️
✅[實體]4/14(日)A05-SPSS統計實戰班：問卷與量表統計分析 [確定開班] ☑️

-----

✨本公司提供【流行病學】與【生物統計學】線上課程，請至匯東華統計學院

✨匯東華會員制

-----

問題

研究人員通過一項國家大腸癌篩檢計畫，調查飲食和體育鍛煉計畫對超重或肥胖人群體重的影響。該研究為一項多中心隨機對照試驗。介入措施包括為期 12 個月的個性化、以行為為重點的減肥計畫。對照組治療僅包括一份減肥手冊。參與者為超重或肥胖的成年人（50-74 歲），他們在糞便潛血試驗結果呈陽性後接受結腸鏡檢查，並經組織病理學檢查確診為腺瘤。共招募 329 名參與者隨機分配到介入組（163 人）或對照組（166 人）。[1]

主要結果是 12 個月內的體重變化。在追蹤過程中，介入組有 148 人（91%）、對照組有 157 人（95%）獲得主要結果資料。12 個月後，介入組的平均體重減輕了 3.50 千克（95% 信賴區間為 2.70 至 4.30；標準誤差為 0.40），而對照組的平均體重減輕 0.78 千克（0.19 至 1.38；標準誤差為 0.30）。介入組的體重減輕幅度明顯更大（平均差異為 2.69 千克，1.70 至 3.67；P<0.001）。結論是，在全國老年人結直腸癌篩檢計畫中啟動飲食和體育鍛煉介入，可以實現明顯的體重減輕，為降低病人風險提供巨大的潛力。

下列敘述何者正確？

a) 樣本估計容易出現抽樣誤差

b) 從母群體中抽取樣本會產生抽樣誤差

c) 治療組平均體重減輕的標準誤差可以衡量樣本平均值作為母群體參數估計值的準確性

d) 一般來說，如果樣本量增加，治療組的標準誤差也會增加。

答案

a、b 和 c 正確，d 錯誤。

詳細說明

該試驗旨在研究飲食和體育鍛煉介入對超重或肥胖族群體重的影響。該試驗是一項隨機對照試驗，從母群體中選取一組樣本。治療組的平均體重減輕量是對母群體參數的估計；亦即，若向母群體中的所有成員提供介入或對照治療，將達到的母群體平均體重減輕量。母群體參數是未知的。樣本估計值（有時稱為點估計值）用於推論介入與對照的效果。上述試驗中的樣本只是可以從母群體中選取的眾多樣本之一。來自抽樣的性質意味著每個樣本的發病率和人口特徵都會與其他樣本不同，任何樣本的特徵都不可能與母群體中的特徵相同。因此，根據樣本估計值對母群體參數進行推論會存在不確定性。統計的目的就是量化這些推論的不確定性。

在上述試驗中，治療組平均體重減輕的樣本估計值必須與母群體參數的大小相似。然而，由於抽樣的性質，它們不可能完全相同。因此，樣本估計值容易出現抽樣誤差（a正確）。一般來說，抽樣誤差是指樣本估計值與母群體參數間的大小差異。統計意義上的 "誤差 "一詞並不是指抽樣時出現錯誤。誤差指的是樣本平均值作為母群體參數的估計值的不準確性—此為獲取樣本對母群體進行推論的直接結果（b正確）。由於母群體參數是未知的，因此抽樣誤差是一個理論概念。

每個治療組追蹤時體重變化的平均值是該治療組的母群體參數的估計值。抽樣誤差用平均值的標準誤差來量化。平均值的標準誤差（SEM），也簡稱為標準誤差（SE），用於衡量樣本平均值作為母群體參數（c正確）估計值的準確性。每個治療組的樣本估計值的標準誤差來自樣本資料；其計算方法為 12 個月時體重變化的標準差除以治療組參與者人數的平方根。一般來說，標準誤差越大，樣本平均值作為母群體參數的估計值就越不準確。而隨著樣本量的增加，標準誤差會減小（d錯誤）。因為隨著樣本量的增加會越接近母群體的樣本量，樣本估計值會變得更接近母群體參數值，從而成為更準確的估計值，抽樣誤差也將隨之減小。

治療組追蹤時平均體重變化的標準誤差本身用途有限。對於每個治療組，平均值的標準誤差用於得出追蹤時平均體重變化這一母群體參數的 95% 信賴區間。信賴區間為一個數值範圍，用於量化樣本平均值作為母群體參數估計值的不確定性。[2] 不過，在比較介入治療與對照治療時，較佳的作法為列出治療組間 12 個月平均體重變化差異的信賴區間，而並非比較各治療組平均體重變化的信賴區間，這樣更有參考價值。[3]

追蹤時不同治療組平均體重變化差異的母群體參數的 95% 信賴區間由差異的標準誤差得出。儘管沒有列出，但差異標準誤差的計算方法與治療組標準誤差的計算方法類似。要得出治療組平均值差異的標準誤差，需要將每個治療組的樣本變異數除以樣本量；然後將得出的數值相加，該數值的平方根等於樣本平均值差異的標準誤差。治療組平均值差異的標準誤差與治療組的標準誤差具有相似的性質。 [Showme說明：本段為公式講解，可跳過]

標準誤差和抽樣誤差經常被混淆。可能是因為這兩個術語間的相似性，都包含 "誤差 "一詞。抽樣誤差是一個理論概念，由標準誤差量化。平均值的標準誤差和標準差也經常被混淆。之前的問題中已進行說明[4]，標準差並不能衡量抽樣誤差，而是量化樣本中變數測量值的變異性（variation）。

Reference:

[1] Anderson AS, Craigie AM, Caswell S, et al. The impact of a bodyweight and physical activity intervention (BeWEL) initiated through a national colorectal cancer screening programme: randomised controlled trial. BMJ 2014;348:g1823.

[2] Sedgwick P. Understanding confidence intervals. BMJ 2014;349:g6051.

[3] Sedgwick P. Randomised controlled trials: inferring significance of treatment effects based on confidence intervals. BMJ 2014;349:g5196.

[4] Sedgwick P. Standard deviation or the standard error of the mean. BMJ 2015;350:h831.

#匯東華 #BMJ統計問題 #抽樣誤差(sampling error) #醫學統計 #標準誤(standard error)