"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

BMJ小小統計問題(111):Unit of observation versus unit of analysis (觀察單位與分析單位)

Cite this as: BMJ 2014;348:g3840

https://www.bmj.com/content/341/bmj.c5929

前言

這期BMJ小小統計問題主要探討在進行觀察性研究時,選擇不同的「分析單位(Unit of Analysis)」和「觀察單位(Unit of Observation)」如何影響研究結果和結論的可靠性。層次(Level)或單位(Unit)經常在研究中被忽視,導致研究問題單位、理論單位、觀察單位、分析單位、推論單位不一致的問題。文章以群集隨機對照試驗(Cluster Randomized Controlled Trial)為例,說明如果選擇不當,可能會增加產生偽顯著結果和誤導性結論的風險。此外,文章也提到生態學研究中相似的問題,特別是生態謬誤(Ecological Fallacy)的風險。可與#第54題:Units of sampling, observation, and analysis (抽樣、觀察與分析單位)一同閱讀。

Hope u enjoy it

完整合輯請見學習專區/BMJ小小統計問題

10月份實體課程招生中,多種研究與統計課程等你挖掘

新上市線上課程:eAI02:Step by Step ChatGPT高效醫學論文寫作:關聯性研究]

✨本公司提供【流行病學】與【生物統計學】線上課程

匯東華會員制詳情。

課程介紹與報名

 

問題

研究人員調查一個以學校為基礎的教育計劃,該計劃旨在減少7至11歲兒童飲用碳酸飲料(Carbonated Drinks),以防止他們體重增加。這項研究使用集群隨機對照試驗(Cluster Randomised Controlled Trial)的研究設計。該計劃在一個學年內實施,重點是促進健康飲食。對照組(Control Group)沒有接受任何干預。在英格蘭西南部,有六所小學被招募參與,並有29個班級參與了試驗。班級被隨機分配到治療組,其中15個班級被分配到教育計劃(共325名兒童),14個班級被分配到對照組(共319名兒童)[1]。

 

結果的衡量指標包括碳酸飲料的攝取量。每個孩子記錄在基線階段和試驗結束時三天內所喝的碳酸飲料杯數(平均容量為250毫升),並計算與基線的變化。

對於每一個班級(即集群),都計算所有孩子在碳酸飲料消費量上的平均變化。然後,將不同治療組在集群內的平均變化進行比較。

 

在一個學年的時間裡,干預組中每個集群的碳酸飲料消費量平均減少了0.6杯,而對照組中則平均增加了0.2杯(平均差值為0.7,95%的信賴區間為0.1~1.3)。

 

下列何者正確?

a) 觀察的單位是班級

b) 分析的單位是班級

c) 可以假設班級(集群)內孩子之間的測量是相互獨立的


 

答案

“b) 分析的單位是班級”正確,a、c錯誤。

詳細說明

觀察單位(Unit of Observation)和分析單位(Unit of Analysis)經常被混淆。觀察單位,有時也被稱為測量單位(Unit of Measurement),在統計學上被定義為“誰”或“什麼”是被測量或收集資料的對象。分析單位在統計學上被定義為“誰”或“什麼”是被分析和得出結論的對象。上述試驗使用集群隨機對照試驗(Cluster Randomised Controlled Trial)的研究設計[1]。

 

參與者是通過集群抽樣(Cluster Sampling)來招募[2]。在英格蘭西南部,有六所小學被招募參與,並有29個班級參與試驗。班級是集群(Cluster),並且每個選定的集群中的所有孩子都被邀請參與。使用集群分配(Cluster Allocation)的方式,是集群而不是孩子被隨機分配到治療組[3]。

 

因此,班級是隨機分配(Randomisation)的單位。隨機分配的單位在統計學上被定義為在試驗中被隨機分配到治療的“誰”或“什麼”[4]。

 

所有在一個集群中的孩子都依據他們集群被分配到的處別接受處置。因此,集群是干預(Intervention)的單位,統計學上被定義為干預被實施的“誰”或“什麼”。

 

在上面的例子中,每個孩子的資料都被記錄,包括在基線階段和試驗結束前三天內碳酸飲料攝取量。每個孩子的碳酸飲料攝取量與基線的變化被獲得。因此,觀察的單位是孩子(a錯誤)。

 

對於每一個集群,班級中孩子在碳酸飲料攝取量上的平均變化被計算出來。比較不同組別在集群內的平均變化(15個干預組,14個對照組)。因此,分析的單位是集群(b正確)。

 

在上述範例中,分析單位(Unit of Analysis)是群集(Cluster)。因為每個群集只提供一個測量值,所以資料被視為獨立的,因此可以使用標準的統計檢定來比較不同組別。另一方面,孩子本身也可以作為觀察單位(Unit of Observation)。然後,組間會根據試驗參與者的碳酸飲料攝取量的平均變化進行比較。然而,若孩子是分析單位,則產生偽顯著結果和誤導性結論的機率會增加。因為使用群集隨機對照試驗(Cluster Randomized Controlled Trial)設計,因此,同一班級內的孩子對介入的反應可能會更相似,不能假設他們是獨立行動的(c錯誤)。同一群集內的孩子比其他群集內的孩子更可能經歷相似的結果,無論是在哪一組。此種群集內測量值的非獨立性通常用組內相關係數(Intraclass Correlation Coefficient, ICC)來評估[6]。

 

若孩子為分析單位,則組間的比較需要考慮到同一班級(即群集)內的孩子間的非獨立性。觀察單位和分析單位的考慮在其他研究設計中也是重要的,例如生態學研究,而不僅僅是臨床試驗。在之前的問題中說明生態學研究[7],其中使用的範例調查全球最富有的50個國家中的23個國家的兒童福利與經濟狀況間的關係[8]。資料是為孩子收集的,並在整個國家進行匯總。因此,觀察單位是孩子,而分析單位是國家。由於觀察單位和分析單位在生態學研究中是不同的,因此這種研究容易受到生態謬誤(Ecological Fallacy)的影響。生態謬誤是指在群體層面上分析收集的資料,並假設結果適用於個體層面的關係[9]。

 

Reference:

[1]James J, Thomas P, Cavan D, Kerr D. Preventing childhood obesity by reducing consumption of carbonated drinks: cluster randomised controlled trial. BMJ 2004;328:1237.

[2]Sedgwick P. Cluster randomised controlled trials. BMJ 2012;345:e4654.

[3]Sedgwick P. Cluster sampling. BMJ 2014a;348:g1215.

[4]Sedgwick P. Treatment allocation in trials: cluster randomisation. BMJ 2014b;348:g2820.

[5]Sedgwick P. Clinical trials: units of randomisation. BMJ 2014;348:g3297.

[6]Sedgwick P. Intraclass correlation coefficient. BMJ 2013;346:f1816.

[7]Sedgwick P. Ecological studies: advantages and disadvantages. BMJ 2014;348:g2979.

[8]Pickett KE, Wilkinson RG. Child wellbeing and income inequality in rich societies: ecological cross sectional study. BMJ 2007;335:1080.

[9]Sedgwick P. The ecological fallacy. BMJ 2011;343:d4670.

 

#集群隨機對照試驗(Cluster Randomized Controlled Trial)

#觀察單位與分析單位(Unit of Observation & Unit of Analysis)

#偽顯著結果(Spurious Significant Findings)

#誤導性結論(Misleading Conclusions)

#組內相關係數(Intraclass Correlation Coefficient, ICC)

#匯東華


想要了解更多流行病學研究設計,可以參考本司線上課程:流行病學總複習

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。