匯東華統計顧問有限公司
"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~
第169題:What is the standard error of the mean? (何謂平均值標準誤?)
本篇文章探討 #平均值標準誤 (standard error of the mean) 在統計推論中的角色,說明其定義與用途,並與 #標準差 的區別進行詳細說明。文章以群集隨機雙盲對照試驗為案例,說明標準誤的計算公式與用途,並闡釋樣本數對標準誤的影響。此外,本文強調 #95%信賴區間 的意義,指出其應用於估計母群體平均值的不確定性,而非描述個體變異範圍。最後,透過多種營養素補充劑對新生兒出生體重影響的實證研究,深入討論標準誤在比較組間差異及進行統計推論中的重要性。推薦一讀。
另本人拙作”ChatGPT於系統性文獻回顧和統合分析之應用”於#台灣護理學會 發行之護理雜誌 2024年10月71卷 5期刊登,歡迎大家批評指教。往後會陸續發表本系列內容,也請大家持續關注。Hope u enjoy it!
AI學術進化系列課程:
我們的目標,在AI時代來臨,能夠善用AI工具,擺脫耗時費力的瑣事,專注於更有價值的事務上,持續進化!
更多學習資源:
聯繫我們的官方LINE:@medatatw,感謝您一路相伴,讓我們在AI時代一起進化! ✨
在一項群集隨機雙盲對照試驗中,研究懷孕期間使用微量營養素補充劑的效果。本試驗設計包含三個治療組,研究兩種介入措施——每日補充鐵與葉酸,以及每日補充多種微量營養素(包括15種維生素與礦物質的建議攝入量)。控制組的治療為每日補充葉酸。研究地點為中國西北地區的兩個農村縣的327個村莊,共招募5828名孕婦。村莊按照1:1:1比例進行隨機分組,並以縣為單位進行分層隨機化處理 [1]。
結局指標
研究主要結局指標為新生兒出生體重。在5828名孕婦中,納入4421名活產嬰兒的出生體重數據進行分析。以下為三個治療組的平均出生體重及相關統計數據:
(1)控制組(葉酸組):平均出生體重為3153.7克(n=1545;95% CI:3131.5至3175.9克;標準差:444.9;標準誤:11.32)。
(2) 鐵與葉酸組:平均出生體重為3173.9克(n=1470;95% CI:3152.2至3195.6克;標準差:424.4;標準誤:11.07)。
(3)多種微量營養素組:平均出生體重為3197.9克(n=1406;95% CI:3175.0至3220.8克;標準差:438.0;標準誤:11.68)。
研究發現,與控制組相比,多種微量營養素組的平均出生體重顯著增加(增加42.3克;P=0.019);鐵與葉酸組的平均出生體重也有增加(增加24.3克),但未達統計顯著性(P=0.169)。
下列敘述何者正確?(單選)
a) 治療組的平均出生體重標準誤,提供一個衡量樣本平均值作為母群體參數估計精確度的指標。
b) 一般而言,隨樣本數增加,治療組的平均出生體重標準誤也會增加。
c) 若所有孕婦都服用葉酸,95%的嬰兒出生體重會落在95%信賴區間(5至3175.9克)內。
d) 約95%的控制組(葉酸組)嬰兒出生體重會落在95%信賴區間(5至3175.9克)內。
a正確,其餘皆錯誤。
樣本平均值與母群體參數
以控制組(葉酸組)為例,樣本的平均出生體重為3153.7克,此為母群體參數之估計值,亦即,若所有孕婦均服用葉酸,整個母群體的平均出生體重理論值應接近此一數字。然而,真實的母群體參數值未知,樣本平均值被稱為點估計值(point estimate)。 理論上,樣本平均值應接近群體平均值,但通常不會完全相等。不一致性源於抽樣誤差(sampling error),即由於研究只基於母群體的一部分樣本而產生的誤差。
標準誤的作用
標準誤(standard error) 可以量化樣本平均值作為母群體參數估計之準確性,因此,a正確。標準誤縮寫為SE,在統計推論中(如假設檢定或信賴區間估計)扮演重要角色。
標準誤的計算與樣本數的影響
控制組平均出生體重的標準誤是由樣本標準差(standard deviation, SD)除以樣本數的平方根計算得出。公式為:
SE=SD/(N)^0.5
隨樣本數增加,標準誤會減少,因為樣本數越接近母群體規模,樣本平均值越接近母群體平均值。因此,b錯誤。
平均數標準誤的用途
單憑控制組出生體重的平均數標準誤本身,其用途有限。它被用於推導信賴區間,即量化樣本平均值作為母群體參數估計的不確定性之一個數值範圍。信賴區間被視為對母群體參數的區間估計值,通常附有一個百分比,最常見的是95%信賴區間。
對於葉酸治療的母群體平均出生體重,95%信賴區間是基於樣本平均值的上下1.96個標準誤計算所得,即:
(3153.7克−1.96×11.32)至(3153.7克+1.96×11.32)
計算結果為 3131.5克至3175.9克。因此,可以估計該母群體平均值有95%的機率包含在3131.5克至3175.9克間。 然而,無法確定該區間中的哪個具體值為母群體平均值。此外,有5%的機率(0.05)該信賴區間可能完全不包括母群體平均值。 儘管如此,樣本平均值仍然是對母群體參數之最佳估計值,而信賴區間則描述我們對該估計值的不確定性。
95%信賴區間並非描述若所有孕婦都服用葉酸時,母群體中出生體重的預期變異範圍(c錯誤)。此外,95%信賴區間也非描述試驗中葉酸治療組觀察到的出生體重變異範圍(d錯誤)。事實上,用來描述樣本中出生體重變異的統計為標準差。標準差和標準誤常常被混淆。區分這兩者的記憶方法是:標準誤用於估計,標準差用於描述。具體來說,標準誤用於估計母群體平均值的不確定性,而標準差用於描述樣本數據的變異程度。
葉酸治療組中出生體重的樣本標準差可用來計算樣本中一定比例出生體重的範圍。如先前問題中所述[2]。大約68%的嬰兒出生體重與樣本平均值的差距不超過一個樣本標準差。此外,大約95%的嬰兒出生體重與樣本平均值的差距不超過兩個樣本標準差,約99%的嬰兒出生體重與樣本平均值的差距不超過三個樣本標準差。
當將每個治療組與對照組進行比較時,如先前問題所述[3],更好的做法是,採用比較組別間平均出生體重之差異,而非僅針對每個治療組的出生體重報告信賴區間。這些信賴區間可量化樣本中治療與對照組平均出生體重差異的估計值之不準確性,以作為母群體中實際差異的估計值。研究者報告指出,與對照組相比,兩種治療的平均出生體重均較高——多種微量營養素組增加42.3克(95%信賴區間為7.1至77.5),鐵與葉酸組增加24.3克(95%信賴區間為−10.3至59.0)。
標準誤也可用於其他樣本估計值的計算,除樣本平均值外,還包括比例、相對危險性及勝算。每個估計值的標準誤與樣本平均值的標準誤用法類似,可用於計算母群體參數的95%信賴區間。
Reference:
[1] Zeng L, Cheng Y, Dang S, Yan H, Dibley MJ, Chang S, et al. Impact of micronutrient supplementation during pregnancy on birth weight, duration of gestation, and perinatal mortality in rural western China: double blind cluster randomised controlled trial. BMJ 2008;337:a2001.
[2] Sedgwick P. Standard deviation versus standard error. BMJ 2011;343:d8010.
[3] Sedgwick P. Confidence intervals and statistical significance. BMJ 2012;344:e2238.
#匯東華 #醫學統計 #標準誤 #信賴區間 #統計推論 #標準差
數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。
全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。
Fig1.同一個Project資料散落在不同tables,無法使用
Fig2.整併與清理為可分析的table
Fig.3整理和分析後形成有意義的知識
概念與流程示意圖
課程規劃核心為以「學習者」為中心進行「傳承」
以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。
開設線上統計學院
SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)
課程網址:https://medata.teaches.cc/
課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M
課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E
臨床研究思維-Open your mind
課程網址:https://medata.teaches.cc/
課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk
為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。