"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

BMJ小小統計問題(133):Statistical tests for independent groups: numerical data (獨立組別之母數統計檢定:數值資料)

Cite this as: BMJ 2012;345:e8145

https://www.bmj.com/content/345/bmj.e8145


                                             

前言

近期公司業務量跟演講邀約讓公司幾乎滿載,感謝各位朋友的支持。個人不推崇特定工具,也不追求風潮,但會持續學習更新知識與業界動態。自從2023年1月中在Jack Huang 資訊工程師推薦下開始接觸ChatGPT後,直覺它是一把絕世神兵,更是鋒利的雙刃劍,勢必顛覆目前主流規範。沒多久開始將其整併入公司作業中,越能體會它的威力,無論是好是壞。本質上,它是AI 賦能 (AI empowerment)概念,換句話說,它能夠增幅使用者的能力,但增幅多少,個人越來越覺得與使用者本身的專業積累與心態開放性息息相關。學習範式勢必改變,而思惟層次,或稱為認知疆界將會越來越重要。這些專業基本概念更要去理解,因為,這樣才能使用”精準”的字彙撰寫prompt與ChatGPT溝通無誤,而能產出預期品質的內容。重要的是,更能夠判斷這些AI工具的產出內容是否有誤,以及,如何指引它往正確的方向走。

 

另外,可以檢視本期內容標題,即能知道統計分析方法的選擇重點:依據應用場景。Hope u enjoy it。


-----

路徑:匯東華官網/學習專區/BMJ小小統計問題

 


-----

✨本公司提供【流行病學】與【生物統計學】線上課程,請至匯東華統計學院

匯東華會員制


-----

問題

研究人員調查一項旨在減少碳酸飲料攝取量的學校教育計畫是否能防止兒童體重過度增長。研究採用分組隨機對照試驗設計。介入措施為期一學年,包括重點教育,提倡健康飲食,同時不鼓勵飲用碳酸飲料。對照組不接受任何介入。從基線開始,對兒童進行為期三年的追蹤調查[1]。

 

主要結果指標包括身體質量指數(BMI)轉換為特定年齡和性別的 Z 值。六所學校共招募 644 名 7 至 11 歲的兒童。對 434 名兒童進行基線與三年後的測量。對 BMI z 分數的常態分佈假設進行驗證。追蹤時,對照組的年齡和性別BMI z得分平均上升0.1(標準差為0.53),而介入組則下降0.01(標準差為0.58)。治療組間的平均差異不顯著(0.1(95% 信賴區間 0 至 0.21);P=0.06)。

 

以下哪種統計檢定最可能用於比較治療組別間從基線算起三年內 BMI z 值平均變化之平均差異?

a) 配對 t 檢定

b) 學生 t 檢定

c) Wilcoxon rank sum test

d) Wilcoxon signed ranks test


 

答案

Student’s t test (answer b)最可能用於比較兩組間BMI變化平均值之差異檢定。

 

 

 

詳細說明

最有可能使用 Student’s t test(答案 b)比較治療組別從基線算起三年內體重指數 z 值平均變化的差異。該試驗調查一項旨在減少碳酸飲料攝取量的教育計畫是否能防止兒童體重過度增長。結果測量包括基線和三年後記錄的BMI值。不同年齡段兒童的BMI值分布不同,每個分布使用一個獨特的平均值和標準差。預計男孩BMI平均高於女孩。因此,每個兒童的BMI都被轉換成與其年齡和性別相對應的 z 值。使用 z 值對結果測量進行標準化的方法已在之前進行說明[2]。計算每個兒童的 BMI z 評分變化,即用三年後的 BMI z 評分減去基線時的 BMI z 分數。將介入組與對照組三年內 BMI z 分數平均變化進行比較,從而估算出本教育計畫在防止兒童體重過度增長方面的真實效果。

 

Student’s t test(答案 b)最有可能用於比較治療組別在三年追蹤期間 BMI z 分數的平均變化。Student’s t test也稱為獨立樣本 t 檢定[3],為比較兩個獨立組中連續測量變數的均值。為一種母數檢定,假設兩組中按年齡和性別劃分的BMI z 值變化分值之分布近似於常態分布,且兩組的變異數相等,即變異數同質性成立。研究人員指出,BMI z 分數的符合常態分布。母數檢定已於之前說明[4]。

 

Student’s t test(答案 b)最有可能被採用的另一個線索為,研究人員提供治療組間之 BMI z 分數與基線相比平均變化的 95% 信賴區間。只有在符合母數檢定所需的常態性假設的情況下,才能得出平均差異的 95% 賴信區間。若無法進行常態性假設,則應使用 Wilcoxon rank sum test(答案 c)--一種無母數檢定法。然而,在此情況下,得出治療組間平均差的 95%信賴區間是不明智的。

 

在比較介入治療與對照治療的統計檢定中,虛無假設為:在抽取樣本的母群體中,治療組間在三年追蹤期間BMI z 分數的平均變化沒有差異。對立假設為雙尾假設:在母群體中,與對照組相比,介入組在三年追蹤期間的 BMI z 分數平均變化較大或較小。雖然在追蹤時,對照組的 BMI z 分數平均增加 0.1,而介入組則減少 0.01,但在 5%的顯著水準上,組間的平均差異並不顯著(P=0.06)。因此,沒有證據表明不同療法對三年內BMI z 分數平均變化的影響存在差異。

 

配對 t 檢定(答案 a)用於比較連續變數的兩個相關測量值。每個兒童的年齡和性別 BMI z 分數在基線和三年後都有記錄。配對 t 檢定可用於檢驗各治療組三年內 BMI z 分數的平均變化與零是否有顯著差異。配對 t 檢驗是一種母數檢定,假定人群中 BMI z 分數變化的分佈是常態分布。雖然分析每個治療組間 BMI z 分數的平均變化可能有用,但比較介入預組和對照組的平均變化更有參考價值。對照組的兒童沒有接受任何介入,因此該組提供三年內 BMI z 分數自然變化的估計值。然而,如之前所提,調查組內的平均變化可能會產生誤導[5]。

 

Wilcoxon rank sum test(答案 c)和 Wilcoxon signed ranks test(答案 d)是無母數法,已在之前介紹過[6-7]。Wilcoxon rank sum test用於比較兩個獨立組別在連續或序位測量的變數中之差異。Wilcoxon signed ranks test用於比較連續或序位變數中兩個相關樣本的情況。Wilcoxon rank sum test對Wilcoxon signed ranks test均為無母數法,因此不假定變數在母群體中的分布。當變數的分布不符合常態性假設或資料轉換後不符合常態性假設時,就需要使用此兩種檢定。資料的對數變換已在之前介紹過[8]。若不能進行常態性假設,且使用無母數檢定,則計算治療組別間 BMI z 分數與基線相比平均變化的 95% 信賴區間就是不合理的。

 

Reference:

[1] James J, Thomas P, Kerr D. Preventing childhood obesity: two year follow-up results from the Christchurch obesity prevention programme in schools (CHOPPS). BMJ 2007;335:762-5.

[2] Sedgwick P. Standardisation of outcome measures (z scores). BMJ 2012;345:e6178.

[3] Sedgwick P. Independent samples t test. BMJ 2010;340:c2673.

[4] Sedgwick P. Parametric v non-parametric statistical tests. BMJ 2012;344:e1753.

[5] Sedgwick P. Analysis of outcome measures within treatment groups. BMJ2012;345:e7201.

[6] Sedgwick P. Non-parametric statistical tests for independent groups: numerical data. BMJ 2012;344:e3354.

[7] Sedgwick P. Non-parametric statistical tests for two related groups: numerical data. BMJ 2012;344:e2537.

[8] Sedgwick P. Log transformation of data. BMJ 2012;345:e6727.

 

#匯東華 #BMJ統計問題 #Student’s t test #醫學統計 #兩組連續性變數檢定 #母數分析 #無母數分析


 


 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。