"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

 BMJ小小統計問題(10)                                                         

前言:
這三周的BMJ統計(7)-(9)談的是P值、假設檢定、臨床與統計意義,相信大家已經對推論性統計有基本概念。本篇文章要談的是信賴區間、P值及統計意義三者彼此間的關係。有個重點一定要看懂:結果變數是比例型統計量,如RR、OR等跟差異型統計量,如平均值差異,當統計結果不顯著時,95%信賴區間會包括哪個數值。
題目:
一項隨機安慰劑對照試驗研究了尼古丁貼片對吸菸孕婦的成效。干預措施是在分娩前使用16小時的尼古丁貼片。研究對象為18歲以上每天至少抽5支菸,而且孕齡從12到20周的孕婦。總共自法國23個產科病房招募了402名婦女。參與者被隨機分為干預組(n=203)和安慰劑組(n=199). [1] 結果測量包括在分娩前完全禁菸的達成率以及出生體重。尼古丁貼片組有5.5% (n=11)的女性完全戒斷,安慰劑組有5.1% (n=10)的女性完全戒斷(勝算比:OR=1.08, 95%信賴區間 0.45 - 2.60)。尼古丁貼片組的平均出生體重較高(3065(標準誤差44 g) vs 3015 g (44 g);差異50 g,−71.1 ~ 172.3)。
下列哪些陳述(如果有的話)是正確的? (複選)
a)在5%水準上戒斷OR具有統計意義,因為相關的95%信賴區間不包括零
b)治療組之間平均出生體重的差異在5%水準上沒有統計意義,因為相關的95%信賴區間包括零
c) 95%信賴區間在5%顯著性水準上對統計假設進行檢驗。
答案:
b)治療組之間平均出生體重的差異在5%水準上沒有統計意義,因為相關的95%信賴區間包括零 以及 c) 95%信賴區間在5%顯著性水準上對統計假設進行檢驗,為正確。
“a)在5%水準上戒斷OR具有統計意義,因為相關的95%信賴區間不包括零”錯誤
說明:
干預組與安慰劑組在分娩前戒菸率的勝算比(OR)為1.08 (0.45 - 2.60),而干預組的平均出生體重更大(差異50 g,−71.1 - 172.3)。95%信賴區間是分娩前戒菸OR和平均出生體重差異的母群體參數的區間估計。信賴區間表示由於抽樣誤差,樣本在估計母群體參數時的不確定性。[2] 對於每個結果,可以進行統計假設檢驗,以確定治療組別間是否存在顯著差異。統計假設檢驗已在前面的問題說明。[3] 假設檢驗的顯著水準通常設為0.05 (5%)。[4] 當進行假設檢驗時,母群體參數的95%信賴區間和5%顯著性水準之間有一個特定的關聯。
使用傳統的統計假設檢驗來確定治療組別間在分娩前禁菸率差異是否顯著。治療組別間使用OR進行比較。[5] 假設檢驗從假設兩組相等開始。虛無假設表示,在獲得樣本的孕婦母群體中,治療組別間的禁菸OR沒有差異,即OR等於1.0 (相同)。對立假設是雙尾的,即OR是低於或高於一。顯著水準為0.05 (5%)。研究人員報告OR的統計檢驗P值為0.87,因此,在5%的水準上,治療組別之間至分娩前的戒菸率差異不顯著。統計顯著性的推論可以在95%信賴區間的基礎上得出。母群體OR的95%置信區間為0.45 ~ 2.60。由於95%信賴區間包括1,我們可以推斷,在5%水準上,治療組別間在完全戒斷直至分娩的差異並不顯著——即P>0.05 (a錯誤)。
一般來說,如果比例 (ratio) 統計值 (如相對風險、危險比或勝算比)的95%信賴區間包括1,則所比較的組別間之統計假設檢驗在5%水準上將不顯著。反之,若比較組別間的95%信賴區間不包括1,則統計假設檢驗在5%水準尚將呈現顯著結果,即虛無假設將被拒絕,以支持對立假設。如果95%信賴區間上限或下限等於1.0,那麼P值將等於0.05 (5%)。比例統計值的95%信賴區間永遠不會跨過零——下限將大於零,上限以無窮大為界。基於比例統計值的95%信賴區間在5%水準上的統計顯著性推論主要圍繞信賴區間是否跨過1。這種對比例統計量進行統計意義推論的過程不應與以治療組別間差異為結果(如出生體重)的過程互相混淆,此為基於信賴區間是否跨過零 (a錯誤)。
傳統假設檢驗也被用來檢驗治療組別間的平均出生體重差異。虛無假設為在獲得樣本的孕婦母群體中,治療組別間的平均出生體重沒有差異,也就是說,平均差異為零。對立假設是雙尾的,即均值差小於或大於零。臨界顯著性水準為0.05 (5%)。出生體重平均差異的統計檢驗之P值為0.41,因此,組間的平均出生體重的差異在5%水準上不顯著。統計顯著性的推論可以在95%信賴區間的基礎上得到。平均出生體重的人口差異的95%信賴區間為(- 71.1 - 172.3 g)。由於95%信賴區間跨過零,可以推論,在5%水準下,組間的平均出生體重差異不顯著——即P>0.05 (b正確)。
一般來說,如果兩個治療組別間的結果差異之95%信賴區間,如平均值或百分比的差異包含零,那麼對於差異的統計假設檢驗在5%的水準上就不顯著。如果95%信賴區間排除了零,那麼統計假設的檢驗將在5%水準上顯著,虛無假設將被拒絕,以支持對立假設。如果95%信賴區間的上限或下限等於零,那麼P值將等於0.05 (5%)。
如前所述,基於5%的臨界顯著水準的統計假設檢驗是二分法檢驗。計算出的P值是一個機率,是對樣本支持虛無假設證據強度的衡量。如果P值小於0.05 (5%),虛無假設將被拒絕,取而代之的是對立假設。一般來說,P值愈小,說明治療組別間在結果的差異愈大或相關性愈強。然而,P值本身並不能直接說明治療效果的大小。如上所述,95%信賴區間與P值相似,因為它也可以用於在5%顯著性水準上進行二分類的統計假設檢驗(c正確)。相對於P值,95%信賴區間顯示治療效果的方向和大小,特別是,95%信賴區間允許在統計顯著性的基礎上評估治療效果的臨床顯著性。[6] 因此,信賴區間比P值更可取。儘管如此,在期刊文章中報告信賴區間和P值都是有用的,因為它們提供了互補的統計測量值。
原文:
The efficacy of nicotine patches in pregnant women who smoked was investigated using a randomised placebo controlled trial. The intervention was the administration of 16 hour nicotine patches until the time of delivery. Participants were pregnant women over 18 years who smoked at least five cigarettes a day and whose babies were between 12 and 20 weeks’ gestation. In total, 402 women were recruited from 23 maternity wards throughout France. Participants were randomised to the intervention (n=203) or placebo patches (n=199).[1] The outcome measures included achievement of complete abstinence until delivery and birth weight. Complete abstinence was achieved by 5.5% (n=11) of women in the nicotine patch group and 5.1% (n=10) in the placebo group (odds ratio 1.08, 95% confidence interval 0.45 to 2.60). The mean birth weight was higher in the nicotine patch group (3065 (standard error 44 g) v 3015 g (44 g); difference 50 g, −71.1 to 172.3). Which of the following statements, if any, are true?
a) The odds ratio for abstinence until delivery was statistically significant at the 5% level because the associated 95% confidence interval did not straddle zero
b) The difference between treatment groups in mean birth weight was not statistically significant at the 5% level because the associated 95% confidence interval straddled zero
c) A 95% confidence interval provides a test of the statistical hypotheses at the 5% level of significance.
Answers
Statements b and c are true, whereas a is false.
Reference:
[1] Berlin I, Grangé G, Jacob N, Tanguy M-L. Nicotine patches in pregnant smokers: randomised, placebo controlled, multicentre trial of efficacy. BMJ 2014;348:g1622.
[2] Sedgwick P. Understanding confidence intervals. BM J 2014;349:g6051.
[3] Sedgwick P. Understanding statistical hypothesis testing. BMJ 2014;348:g3557.
[4] Sedgwick P. Understanding P values. BMJ 2014;349:g4550.
[5] Sedgwick P. Odds and odds ratios. BMJ 2013;347:f5067.
[6] Sedgwick P. Clinical significance versus statistical significance. BMJ 2014;348:g2130.
Reference: BMJ 2015;350:h1113

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。