"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

醫學研究常用統計指標(2):統計指標意義、臨界值、應用與舉例

文獻連結:https://pubmed.ncbi.nlm.nih.gov/34633993/

醫學研究統計指標

醫學研究常用統計指標(2):統計指標意義、臨界值、應用、舉例與說明

匯東華統計顧問有限公司 陳秀敏 博士

 

 

Amsterdam University Medical Centers麻醉科Patrick Schober教授於2021年發表一篇論文:《Statistics From A (Agreement) to Z (z Score): A Guide to Interpreting Common Measures of Association, Agreement, Diagnostic Accuracy, Effect Size, Heterogeneity, and Reliability in Medical Research》,對對醫學研究中的一些常用統計指標進行淺顯易懂的說明與解釋。有興趣的朋友,能找全文進行閱讀。不過需要提醒的是,本篇文章雖然提供統計檢定結果的典型解讀方式,但並非所有情況都能一體適用。因為臨界值的使用有其本身的限制,且這些值可能會受到特定的臨床或科學環境的影響。

 

前一輯已先針對meta-analysis常用指標進行介紹。本輯針對Coefficient of determination (R2)、Cronbach’s alpha (α)以及Z scores進行說明。

 

Source:

Schober P, Mascha E, Vetter T. Statistics From A (Agreement) to Z (z Score): A Guide to Interpreting Common Measures of Association, Agreement, Diagnostic Accuracy, Effect Size, Heterogeneity, and Reliability in Medical Research. Anesthesia and Analgesia. 10/11 2021; Publish Ahead of Printdoi:10.1213/ANE.0000000000005773  

 

https://pubmed.ncbi.nlm.nih.gov/34633993/

 

決定係數(Coefficient of determination (R2))

為皮爾森相關係數的平方(或R²,即決定係數)。意指一個變數的變異量中由另一個變數解釋的比例(或百分比)。如,表格1中的5個解釋變異量<1%、1%到15%、16%到48%、49%到80%,和≥81%,並可以解釋為「可忽略」、「小」、「中等」、「重要」和「非常高」的變異量解釋。

 

Cronbach’s alpha (α)

Cronbach's alpha(α)是衡量信度的指標,用於評估多項評分量表內部一致性的測量。評分量表常見於心理學和社會科學領域,用以處理潛在構念(latent construct)。這些構念無法直接測量,例如自尊、焦慮、憂鬱、身體化(somatization)、災難化(catastrophizing)或韌性。一個常見的例子是Likert-type評分量表,評分者或受訪者依據每個題項描述的符合程度,例如“強烈同意”、“同意”、“中立”、“不同意”或“強烈不同意”,針對一系列的測試或調查題目之觀察、感知、態度、知識、表現等進行分類。在麻醉和與之相關的手術醫學、疼痛醫學和安寧照護領域,由於越來越重視無法直接測量的病人健康方面,例如病人滿意度、復健品質或與健康相關的生活品質,心理計量評分量表的重要性逐漸增加。

 

在發展、精煉或評估評分量表的研究中,Cronbach's alpha是最常報告的內部一致性測量指標。Cronbach's alpha的主要假設是所有量表題項都是連續且呈常態分布,所有量表題項都與同一個潛在構念有關,每個項目對總量表得分的貢獻相等(稱為tau equivalence)。當所有量表題項反映相同構念時,整個量表題項的不同子集會產生一致的結果。Cronbach's alpha測量量表題項間的相關性。其值通常在0到1之間,越接近1表示內部一致性越高。但Cronbach's alpha的值會受到題項數量明顯的影響(在其他條件相同下,題項越多,Cronbach’s alpha越高),當數值很高時,可能僅表示測試題項有高度冗餘。

 

Z分數(或z統計量)(Z scores (or z statistics))

Z分數描述資料點與平均值間的距離,以標準差單位表示。換句話說,Z分數為0,則位於平均值上,Z分數為2則位於均值以上的2個標準差處,Z分數為-1則位於均值以下的1個標準差處。雖然醫學文獻通常不會報告Z值,但多數研究中都有使用它們。

 

(✍️Showme補充說明:簡而言之,Z值=該數值距離平均數幾個標準差)

 

當從樣本推論到母群體時,主要依賴類似的Z統計量和t統計量,它們構成各種假設檢定中統計推論的基礎。這些統計量測量樣本平均值(或平均值差異)與虛無假設值(通常為0)間的距離。迴歸分析的結果偶爾以標準化迴歸係數顯示,即將模型中所有變數值轉換為Z分數後分析所得之係數。前一輯所描述的相關概念,即以標準差為單位描述平均值的差異。

 

雖然Z分數理論上範圍不受限,但觀察到絕對值>5的機率幾乎為0,甚至>3的值也不太可能出現,因為當資料呈常態分布時,99.7%的所有資料點落在平均值的±3個標準差內。通常絕對值越高,觀察到比該值以及更極端值的機率就越低。因此,Z分數是評估特定資料點與同一樣本的其他資料點或參考族群相比是否為潛在異常值之便利作法。

 

例如,Z分數常用於生長和體重圖表中,以識別兒童發育是否異常,並調整年齡的BMI值,其中Z分數>±2被視為體重過重或過輕。許多實驗室測試的參考範圍被定義為健康參考族群分布中間的95%,相當於常態分布變數Z分數從−2到+2的範圍。絕對Z分數<2在某些“正常”範圍內,值≥3的機率非常低,絕對Z分數≥2視為不尋常的值(異常值),≥3視為非常不尋常的值(明顯異常)。

 

然而,Z分數在−2和+2間並不一定意味著觀察結果是“正常”。例如,BMI高於平均值1個標準差(對應於Z分數+1)表示兒童超重的風險。此外,實驗室測試值從一次測量到下一次的明顯增加或減少(如,隨著時間的推移血紅蛋白值的降低)也可能在臨床上令人擔憂,即使實驗室測試值仍在“正常”範圍內。

 

反之,Z值>±2並不總是意味著某種異常。實際上,完全正常族群約有5%資料點位於−2到+2的Z分數範圍外。此外,當多個資料點被檢查是否有異常值時(如,同時在1位病人中執行多個實驗室檢查),偶然觀察到至少1個異常高值的機率會明顯增加。須注意,當基於正常族群的Z分數為參考或“正常”範圍時,不應假設可以使用2和−2作為區分“正常”和“異常”的切點,因為只有95%的個案在“正常”範圍內。必須選擇一個切點能夠最佳區辨正常人和異常病人,考慮到兩族群重疊部分,可通過診斷準確性研究來完成,以最大化敏感性和特異性。

 

將此三種指標之定義、臨界值、應用、範例與說明整理於表1與表2。

判定係數、Cronbach's alpha、Z score

判定係數、Cronbach's alpha、Z score

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。