"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

BMJ小小統計問題(102):Receiver operating characteristic curves(ROC curves)           

Cite this as: BMJ 2013;346:f2493 

https://www.bmj.com/content/346/bmj.f2493

 

前言

匯東華匆匆走過二載,本月正式邁入三春。今年隨著許多新技術一一浮現,傳統的學習方式勢必也將調整,這是最好的時代。

本周主題是在診斷預測研究經常使用到的ROC curve,主要檢視診斷工具的預測效能,值得一讀。Hope u enjoy it.

 

實體/線上課程好評招生中

線上課程:eAI01-ChatGPT於醫學研究之應用(課程時間:355分鐘) 

網址:https://medata.teaches.cc/course/AI01-ChatGPT-SR

8/9(三)「A01-1-SPSS零基礎入門統計課程」、8/10(四)「A03-Logistic regression」(早)+「A02-存活分析」(午)招生中!

網址:https://reurl.cc/Yv34Dn

8/12(六)、8/13(日):臨床科學研究工作坊第一部築基篇

8/8(二)父親節即將推出線上課程:流行病學總複習。在16小時內有效了解流行病學基本概念、指標、研究法與應用。專為國考與入門者提供之課程。

 

問題

研究人員評估一種名為“測試你的記憶”的認知測試作為阿茲海默症篩檢測試的表現。該篩檢測試旨在使用最少的操作時間,並適合非專業人士使用。在醫療監督下進行自我管理。該測試的最低分是零分,最高分是50分;較低的分數表示有越高的認知障礙[1]。

 

本研究以醫院門診為基礎,招募94例確診為阿茲海默症病人,每例病人從陪同的親屬中招募3名進行年齡配對的無阿茲海默症健康對照(n=282)。所有病人和對照均完成篩檢測試。

 

研究主要為區分阿茲海默症病人和對照組的最佳測試分數。從50到0的每個分數依次被用來作為“陰性”和“陽性”篩檢測試結果間的分界點;所有小於或等於分界點的分數被視為陽性,其他分數則為陰性。對於每個分界點,計算篩檢測試的敏感性和特異性,並使用這些值推導接收者操作特徵曲線(Receiver operating characteristic curves,圖)。接收者操作特徵曲線下的面積為0.95。

(圖說明:區分阿茲海默症病人(n=94)和年齡配對之對照組(n=282)的“測試你的記憶”得分接收者操作特徵曲線。曲線上的數字表示在“陰性”和“陽性”結果之間選定的切點範圍。)


 

下列敘述哪些正確?(複選)

a)對於連續性切點,隨著篩檢測試的敏感性降低,特異性增加

b)(1 -特異性)的值表示篩檢中辨識為陽性(高風險)的對照組比例

c)曲線下面積等於二分之一(0.5)的篩檢測試將完全區分病人和對照




答案

a、b正確,而c錯誤。

 

 

詳細說明

針對”你的記憶”認知測試作為阿茲海默症篩檢工具的表現進行調查。特別是,其目的是在陰性(低風險)和陽性(高風險)結果間建立最佳切點。根據定義,篩檢測試永遠不會100%準確——一些阿茲海默症病人將被歸類為陰性(假陰性),而一些對照組則被歸類為陽性(假陽性)。最佳切點應該是最能區分阿茲海默症病人和對照組的分數——亦即,確定阿茲海默症中陽性比例最大,對照組中陰性比例最大。隨後,該測試可用於篩檢記憶診所的病人;根據最佳切點判斷為陽性的病人將被轉介進行進一步的診斷性臨床評估,因為他們被認為是高危險群。被判斷為陰性者被認為處於低風險,不需要進一步評估。因此,篩檢測試將防止病人進行不必要的臨床評估。

 

記憶工具測試的最低分數是零分,最高分數是50分;分數越低表示認知障礙越嚴重。從50分到0分依次作為篩檢測試結果陰性與陽性的切點;所有小於或等於切點的分數都被認為是陽性結果,其他分數都被認為是陰性結果。對於每個切點,可以得出敏感性和特異性值。研究人員顯示在38 - 45分間的切點之敏感性和特異性值(圖),並在ROC curve上標示。

 

敏感性是指篩檢測試正確識別出阿茲海默症病人的陽性結果的比例。特異性是篩檢測試正確識別出陰性結果的對照參與者的比例。

當切點從50降至零時,阿茲海默症病人被正確識別為陽性(高風險)的比例降低,從而導致更小的敏感性。同時,隨著切點減小,正確識別為陰性(低風險)的對照參與者的比例增大,從而導致更大的特異性(a正確)。因此,最佳切點是基於正確識別病人者和錯誤識別陽性對照(假陽性)的含義之敏感性和特異性間的權衡。

 

每個切點的敏感性對(1 -特異性)的曲線建構出ROC curve。(1 -特異性)是篩檢測試錯誤識別出陽性結果的對照的比例(b正確),因此為假陽性。(1-特異性)的值稱為假陽性率。ROC curve提供一個圖形顯示在每個切點中,正確識別為陽性的病人比例與錯誤識別為陽性的對照比例。要盡可能提高敏感性,降低假陽性率;假陽性率低,則特異性高。

 

若一個切點產生一個完美的篩檢測試——如果它能100%準確地預測出病人和對照組——則敏感性與特異性均為1.0,假陽性率等於零。在此情況下,ROC curve將穿過圖的左上角。實際上,曲線將從原點開始,沿著y軸垂直向上,敏感性為1.0,然後穿過,假陽性率為1.0。因此,ROC curve越靠近左上角,篩檢測試在所有潛在切點上的整體準確性越高。因此,通常選擇最接近左上角的分數線作為最佳分數線。研究人員說,阿茲海默症的最佳切點為42或更低(敏感性93%,特異性86%)。

 

篩檢測試的總體準確性可以通過ROC curve下的面積來量化,通常用比例表示。因此,曲線下的區域越接近1,亦即,曲線越接近左上角,篩檢測試就越能更好地區分診斷為阿茲海默症的病人和對照組。

 

ROC curve從敏感性和假陽性率均為零的(0,0)到敏感性和假陽性率均為1的(1,1)繪製一條對角線。該線上的點表示在每個切點處的敏感性和假陽性率相等。這條線表示,篩檢測試無法區分阿茲海默症病人和對照組;在特定切點上,將二個病人組中相同比例的病人都變視為高風險。任何這樣的篩檢測試之ROC curve下面積均為0.5 (c錯誤)。

 

當比較兩種或兩種以上篩檢測試區分有無特定診斷的病人能力時,ROC curve可能是最有用的。雖然可能有人認為,ROC curve對單個篩檢測試幾乎沒有價值,但若有多個可能的切點,它是一個有用的圖示法。

 

References:

[1]Brown J, Pengas G, Dawson K, Brown LA, Clatworthy P. Self administered cognitive screening test (TYM) for detection of Alzheimer’s disease: cross sectional study. BMJ 2009;338:b2030.

#BMJ Statistics Questions Endgames #篩檢測試 #Screening test #ROC curve #匯東華

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。