"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

 BMJ小小統計問題(30)                                                    前言:

本期內容非常推薦大家閱讀。主要是探討有多重結局指標時,進行多次假設檢定會出現甚麼問題?如本期案例有4個結局指標,使用4次獨立樣本t檢定,會有甚麼問題呢?有解決之道嗎?在研究實務上,我們常會面對類似的情境,就讓我們繼續看下去吧。
  
題目:
  研究人員進行一項隨機對照試驗,以評估鋅補充對霍亂引起的兒童水樣腹瀉之嚴重程度和持續時間的影響[1]。招募有水樣腹瀉,且糞便鏡檢呈霍亂弧菌陽性的兒童,並隨機分配補充鋅或安慰劑。
  下表比較鋅補充組和安慰劑組的主要結果(腹瀉和排便持續時間)和次要結果。所有的假設檢定均採用雙尾、獨立樣本t檢定,設0.05(5%)為顯著水準。研究發現,補充鋅可以減少霍亂兒童腹瀉的持續時間和嚴重程度。
  
鋅補充劑對霍亂兒童臨床結果的影響,下列敘述何者正確?(複選)
a)第一類誤差是當對母群體而言,處理之間沒有差異時,卻拒絕虛無假設而支持對立假設
b)對於每個假設檢定而言,發生第一類誤差的最大機率是0.05
c)對於每個假設檢定而言,沒發生第一類誤差的最小機率是0.95 (95%)
d)當進行多個假設檢定時,第一類誤差發生的機率增加到0.05以上
  
答案:以上皆是。
  
詳細說明:
  假設檢定是在樣本的基礎上對母群體進行推論。然而,有可能這樣的推論不能代表母群體。之前已經描述了假設檢定時可能犯的錯誤類型[2]——第一類和第二類誤差。若在母體中,組別間沒有差異,但在樣本中卻有,則會發生第一類誤差,因此,假設檢定結果會拒絕虛無假設而支持對立假設(A正確)。
  
  每個假設檢定採用獨立樣本t檢定進行[3]。對於每個假設檢定,P值是通過假設重複研究無限次而獲得。在虛無假設成立情形下,P值是這些假設研究中產生的檢驗統計量大於或等於上述研究中計算的檢驗統計量絕對值的比例。顯著性臨界水準設定為0.05(5%)。在無限次研究中,在有最大的檢驗統計量的5%情況下,虛無假設將被拒絕而接受對立假設;因此,對於任何假設檢定,拒絕虛無假設的最大機率是0.05。任何假設檢定都可能導致第一類誤差。因此,每個假設檢定出現第一類誤差的最大機率為0.05 (b正確)。換句話說,任何單一假設檢定不發生第一類誤差的最小機率為0.95 (95%;c正確)。
  
  下表中任何一個假設檢定發生第一類誤差的機率等於1減去沒有任何一個檢驗產生第一類誤差的機率。單個檢定不會導致第一類誤差的機率是0.95。以本例的四個假設檢定中沒有任一個會導致第一類誤差的機率是每個檢定不產生第一類誤差的個別機率之乘積:(0.95×0.95×0.95×0.95)=0.95(**4) =0.815。因此,在表中發生第一類誤差的機率是:(1-0.815)=0.185。一般而言,第一類誤差發生的機率是(1 - 0.95(**x)),其中x是假設檢定的總次數。如果有兩個或更多的檢定,那麼0.95(**x)將小於0.95,第一類誤差的機率將較0.05大 (d正確)。
  
  在單個假設檢定中出現第一類誤差的機率為0.05;然而,當執行多個假設檢定時,錯誤機率會增加。當研究論文進行大量的統計檢定時,必須要小心——最終這些檢定中的一些結果將是第一類誤差所導致的。然而,我們不會知道是哪些。在進行多重檢定時,學者已經提出各種方法來降低第一類誤差,例如Bonferroni法,將於之後的問題中討論。
   
Reference:
[1] Roy SK, Hossain MJ, Khatun W, Chakraborty B, Chowdhury S, Begum A, et al. Zinc supplementation in children with cholera in Bangladesh: randomised controlled trial. BMJ 2008;336:266-8.
[2] Sedgwick P. Errors when statistical hypothesis testing. BMJ2010;340:c2348.
[3] Sedgwick P. Independent samples t test. BMJ2010;340:c2673.
Cite this as: BMJ 2010;340:c2963

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。