"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

 BMJ小小統計問題(37)                                                    前言:

本期的主題我個人很喜歡,承接第35題”簡單線性迴歸”提到的重點:結果外推性的問題。當我們得到分析結果,如何適當地去詮釋,而不會有過度推論的疑慮,是非常重要的概念。有幾分證據,說幾分話。本期提出二個重要名詞:Generalisation (概化) and extrapolation (外推)。除了說明正確詮釋結果
的原則外,也提供論文寫作時,討論一節中的研究限制與未來研究方向之參考。Hope u enjoy it.
  
  
題目:
  研究人員評估腱周自體血液注射(peritendinous autologous blood injections)對跟腱中段病變患者的有效性。進行隨機雙盲對照試驗。介入包括兩次無引導的肌腱周圍注射3毫升的患者全血,間隔一個月。對照組不注射任何物質(僅注射針劑)。兩組的參與者都進行了一項標準化的12周小腿肌肉訓練計畫。
  共有53名成年人(平均年齡49歲,53%為男性)從紐西蘭的一個運動醫學診所招募而來。納入標準包括年齡在18歲以上,有跟腱中段病首發症狀。症狀必須存在至少三個月,並經診斷性超音檢查確診。
  主要測量指標是維多利亞運動評估協會阿基裡斯(VISA-A)評分從基線到6個月間症狀和功能的變化。6個月時,介入組(評分變化18.7分,95%信賴區間12.3-25.1)和對照組(評分變化19.9分,13.6-26.2分)的VISA-A評分顯著改善。然而,6個月時治療(介入減去對照)的總體效果不顯著(−1.2,−10.0-7.9;P = 0.689)。
  
根據以上敘述,下列哪個結論是合理的?
a)該結果也適用於其他運動醫學診所的成年人
b)在12個月後,兩組患者的主要療效均有顯著改善
c)治療的總體效果在12個月後不會顯著
  
答案:
a合理,b,c不合理。
  
詳細說明:
  上述試驗的目的為評估腱周自體血液注射對跟腱中段病變患者的有效性。試驗結果的有效性取決於它們是否能被概化(Generalisation)。
  
  概化意為研究結果可以應用於樣本以外之患者的程度。涉及到未來患者的特徵,包括人口統計學和疾病嚴重程度,及在不同人群中進行的試驗結果適用於他們的程度。如果試驗結果不能用於預測未來接受介入患者的益處,則試驗的價值將非常有限。
  
  為了讓研究的結果是有用的,必須確保樣本對母群體的代表性。然而,對於統計學中“母群體” (population) 的含義,人們常常感到困惑,可能是因為它與一般的日常意義不同,在日常意義上,只是用於地理意義上。在上述試驗中,有明確的納入標準。僅招募年齡在18歲以上且首次出現跟腱中段病變的患者。此外,症狀必須存在至少三個月,並由診斷性超音檢查確診。納入標準具有獨特的人群特徵。從統計學上講,母群體可視為一個無限群體。然而,上述試驗中的樣本對母群體的代表性程度尚不清楚。此外,可能存在的任何差異,例如年齡分佈的差異,對治療效果的影響程度並不明確。
  
  一般而言,多數試驗結果將預測原試驗中心以外的治療效果。沒有理由認為上述試驗結果無法預測在進行試驗的紐西蘭運動醫學診所以外的其他運動診所、醫院或其他國家的成人治療的效果(a合理)。
  
  概化也需注意與研究結果可被應用於與研究母群體不同族群的程度。如,18歲以下有跟腱中段病變病史的患者。必須在每種情況下分別加以判斷。尤其是,兒童(18歲以下)通常被認為與成人有不同的病程,一般建議對他們單獨進行研究。
  
  超越研究週期數值結果的概化稱為外推(extrapolation)。上述試驗的研究週期為6個月,將試驗結果概化至6個月以上是不合理的。雖然兩個治療組在6個月時的主要結果都有顯著改善,但因6-12個月期間,試驗參與者並無進行研究,因此,無法預測此段時間的損傷嚴重程度之進展(b不合理)。也不可能在一年後預測治療(介入與控制)的總體效果(c不合理)。
  
  外推通常在線性迴歸的背景下被描述。之前的簡單線性迴歸之迴歸方程式[2]僅對解釋變數的觀察資料範圍有效。它也有可能在超出最初解釋變數的測量範圍外對結果進行預測。但是,這樣做是不明智的,因為沒有證據支持結果測量和原始測量範圍以外的解釋變數間的關係為何。
   
Reference:
[1] Bell KJ, Fulcher ML, Rowlands DS, Kerse N. Impact of autologous blood injections in treatment of mid-portion Achilles tendinopathy: double blind randomised controlled trial. BMJ 2013;346:f2310.
[2] Sedgwick P. Simple linear regression. BMJ 2013;346:f2340.
Cite this as: BMJ 2013;346:f3022 

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。