匯東華統計顧問有限公司
"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~
第177題:Units of analysis (分析單位)
最近公司業務擴增,以致本幾期出刊時間有所延遲。感謝各位學員、顧客的支持與肯定,以及各醫院、大專院校、學會的邀約。讓匯東華得以持續成長與茁壯。因應AI興起與業務變化,本司也在積極調整流程和業務,與時俱進,提供實際價值給本司內外部顧客。秉持專業、熱忱、創新、創新及永續的核心,期待能與內外部顧客共享共榮。
本期文章聚焦於 #分析單位(Units of Analysis),深入探討分析單位在集群隨機對照試驗中的定義與應用。以瑞士小學生的身體活動介入研究為例,本文詳細解析如何選定「分析單位」對結果解釋與試驗設計的影響,並強調分析單位與觀察單位的區別,說明在處理集群數據時如何避免混淆。特別是針對學校、班級與兒童層級的數據,本文以實例闡明集群分配在減少實際操作困難與污染問題中的重要性。
此外,對於 #公共衛生研究 與 #臨床試驗設計 的專業人員,本文提供關於分析單位選擇與應用的重要見解。針對臨床大數據(如健保資料庫)中的跨層次資料,分析單位的正確選擇、處理與結果解讀不僅是研究設計的核心,更是確保數據分析與結論科學性的重要基石。可跟下列相關文獻一併閱讀,學習效果更佳!
本人拙作”ChatGPT於系統性文獻回顧和統合分析之應用”於#台灣護理學會 發行之護理雜誌 2024年10月71卷 5期刊登,歡迎大家批評指教。往後會陸續發表本系列內容,也請大家持續關注。Hope u enjoy it & Happy Chinese New Year!
相關文獻:
#第54題:Units of sampling, observation, and analysis (抽樣、觀察與分析單位)
#第111題:Unit of observation versus unit of analysis (觀察單位與分析單位)
#第171題:Intraclass correlation coefficient (組內相關係數)
#第172題:Cluster randomised controlled trials: sample size calculations (集群隨機對照試驗:樣本數計算)
#第173題:Stratified cluster sampling (分層集群抽樣)
#第175題:Cluster sampling (集群抽樣)
【線上課程】ePMD02:用別人的數據,做自己的研究:全科醫學公開資料庫介紹與實例應用,原價6,000元,優惠價2,880元。找不到研究數據來源嗎?請看本課程!
更多學習資源:
聯繫我們的官方LINE:@medatatw,感謝您一路相伴,讓我們在AI時代一起進化! ✨
研究者評估一項在一學年期間實施的身體活動計畫對小學生身體和心理健康的效果。研究採用集群隨機對照試驗設計。該身體活動計畫包括每週三節既有的體育課,外加兩節新增的課程、每日的短時間活動休息,以及身體活動作業。對照組的兒童每週僅接受三節既有的體育課【1】。
在瑞士的15所小學中共招募28個班級。這些班級按4:3的比例隨機分配至不同的處理組;9所學校的16個班級分配至介入組,6所學校的12個班級分配至對照組。介入組有297名兒童,對照組有205名兒童。主要結果指標包括每位兒童基線與追蹤之間的變化,例如體脂、心肺適能、身體活動量以及生活品質。研究者報告指出,基於學校的多組分身體活動介入改善兒童的身體活動與適能,並減少肥胖。
以下哪項為分析單位?
a) 兒童
b) 班級
c) 學校
分析單位是兒童(選項 a)。
本項集群隨機對照試驗之目的為評估多組分身體活動計畫對小學生身體和心理健康的影響。對每位兒童記錄基線與追蹤之間的變化,例如體脂、心肺適能、身體活動量以及生活品質。隨後比較接受每種處理的兒童在這些結果指標上的表現。因此,分析單位是兒童(a正確)。在臨床試驗中比較治療時,幾乎總是比較每位參與者接受不同治療後的結果。
從統計學上定義,分析單位是指進行訊息分析的「誰」(who)或「什麼」(what)。在本例中,分析單位為兒童,對接受每種處理的兒童使用描述性統計進行分析,以比較介入組和對照組。由於分析單位是兒童,因此結論與他們有關。
本例使用集群隨機對照試驗設計【2】。研究使用集群隨機分配,而非簡單隨機分配,來將兒童分配到處理組中。即對學校及其所有參與研究的班級進行隨機分配至介入組或對照組,而非直接分配兒童。集群(即班級)是兒童的自然分組。每個班級中的所有兒童均接受其學校被分配的處理——介入或對照。
使用集群隨機分配的主要原因為解決實際操作和污染問題。若試驗參與者是通過簡單隨機分配,則可能導致某些班級中的部分兒童接受介入而其他兒童未接受,從而難以實施干預。此外,若同一學校中的班級被分配到不同的處理組,則可能產生實際操作和污染問題。因此,所有班級都分配到相同的處理組以避免這些問題。
分析單位(unit of analysis)和觀察單位(unit of observation)間有明確區別。如前所述,分析單位從統計學上定義為進行訊息分析並得出結論的「誰」或「什麼」。而觀察單位則是指數據被收集的「誰」或「什麼」。在本例中,觀察單位與分析單位相同,儘管它們不必總是相同。兩者通常在生態學研究(ecological study)中有所不同。
生態學研究在相關問題中有所描述【3】。該範例研究兒童因受傷而入院與社會經濟貧困之間的關聯【4】。數據為兒童所收集,並在英格蘭北部特倫特地區的選區範圍內進行彙總。研究目的是比較不同選區的健康狀況與需求。因此,觀察單位是兒童,而分析單位是選區。
生態學研究的結論為,社會經濟貧困程度最高的選區,兒童因受傷而入院的比率最高。然而,生態學研究未對兒童進行單獨檢查,因此容易受到解釋偏誤的影響,這種偏誤被稱為「生態學謬誤」(ecological fallacy)。生態學謬誤是指在對群體層面的數據進行分析後,將結果推論到個人層面時產生的偏誤。研究報告指出,社會經濟貧困程度最高的選區,兒童因受傷而入院的比率最高。然而,直接認為來自最貧困家庭的兒童最有可能因受傷而住院是錯誤的。
Reference
[1] Kriemler S, Zahner L, Schindler C, Meyer U, Hartmann T, Hebestreit H, et al. Effect of school based physical activity programme (KISS) on fitness and adiposity in primary schoolchildren: cluster randomised controlled trial. BMJ 2010;340:c785.
[2] Sedgwick P. Cluster randomised controlled trials. BMJ 2012;345:e4654.
[3] Sedgwick P. The ecological fallacy. BMJ 2011;343:d4670.
[4] HippisleyCox J, Groom L, Kendrick D, Coupland C, Webber E, Savelyich B. Cross sectional survey of socioeconomic variations in severity and mechanism of childhood injuries in Trent 19927. BMJ 2002;324:1132.
#分析單位 #集群隨機對照試驗 #醫學統計 #兒童健康研究 #身體活動介入 #公共衛生 #臨床研究設計 #匯東華
數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。
全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。
Fig1.同一個Project資料散落在不同tables,無法使用
Fig2.整併與清理為可分析的table
Fig.3整理和分析後形成有意義的知識
概念與流程示意圖
課程規劃核心為以「學習者」為中心進行「傳承」
以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。
開設線上統計學院
SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)
課程網址:https://medata.teaches.cc/
課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M
課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E
臨床研究思維-Open your mind
課程網址:https://medata.teaches.cc/
課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk
為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。