"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

 BMJ小小統計問題(43)                                                    前言:

  流行病學研究法與統計學是密不可分的兩學科。特定的研究設計,要搭配相對應的分析方法。若是把資料拿來就進行分析,沒檢視分析方法的適當性,很容易造成錯誤的分析結果與詮釋。承上周介紹的RR,本周帶入非常重要的兩種研究設計:前瞻性的世代追蹤研究,以及,回溯性的病例對照研究。這二種研究設計是迥然不同的,所以我們採用的分析方法,相對效果量的指標,以及製作的圖表展現方式均有不同。如table 1 baseline characteristics 在世代研究法跟病例對照研究法所要呈現的資訊和百分比(欄%或列%)並不相同。RR vs. OR,實在是太常用了,值得花幾周好好來探討跟釐清。本期是這二種研究設計非常基礎的概念,最後也提到何時可以使用OR代替RR。
  對了,主題的population at risk,意味著處於風險中的族群,就是有罹患特定疾病風險的易感受族群。若以研究接受疫苗注射是否能有效降低covid-19的發生,在研究調查前已經罹患covid-19者,就不是at risk,不能當追蹤的分母,要從總數中剃除。還未罹患covid-19者,你我他,就有感染風險,因此都是at risk(處在風險中),才能納入研究對象,因此才能計算發生率,比較有無注射疫苗兩組的相對危險性(RR,或稱相對風險)。這也是為何病例對照研究無法計算RR,因為它的研究設計沒法計算發生率。Hope u enjoy it.
  
  
題目:
  使用不同研究設計對上消化道癌症的危險因素進行調查,包括伊朗北部Golestan省一項以族群為基礎的病例對照研究(population based case-control study)。該研究調查飲茶習慣與罹患食道鱗狀細胞癌風險的關係。共有300例組織學證實的食道鱗狀細胞癌病人和571例匹配的社區對照。參加者在面對面的採訪中被問及他們的飲茶習慣。研究發現,與喝溫茶相比,喝熱茶與罹患食道癌的風險增加有密切關係[1]。
  在丹麥的一項研究中,研究人員採用基於族群的前瞻性世代設計(population based prospective cohort design)來檢測不同類型的酒精飲料與上消化道(口咽和食道)癌症間的關係。研究人員對參與者的酒精攝入量和吸菸習慣進行基線(baseline)評估。世代成員為年齡在20-98歲的15,117名男性和13,063名女性,平均追蹤時間為13.5年(範圍2-19年)。研究人員報告指出,與不喝酒者相比,適量飲用葡萄酒不太可能增加罹患上消化道癌症的風險,而適量飲用啤酒或烈酒則會明顯增加罹患上消化道癌症的風險[2]。
  
上述何種研究設計有助於對危險族群(the population at risk)進行估計?
a) 病例對照研究
b) 前瞻性世代研究
  
答案:
處於風險中的族群可以通過前瞻性世代研究進行估計(答案b),但無法通過病例對照研究進行估計(答案a)。
  
  
詳細說明:
  為了能夠估計處在有風險的族群,需要由樣本估計上消化道癌症在母群體中的發病率或盛行率。這些估計不僅需要對整個族群,而且需要對參與危險行為的族群和沒有參與危險行為的族群進行估計。世代研究由於是前瞻性的(prospective)研究設計,因此能夠估計處於風險中的族群(population at risk) (答案b正確),但病例對照研究(答案a)則不行,因為它是回溯性的(retrospective)設計。
  
  本研究採用前瞻性世代研究設計,探討不同類型的酒精飲料與上消化道癌症之關係。該世代樣本為年齡20-98歲的15,117名男性和13,063名女性,被選為丹麥成年人口的代表樣本。該世代的前瞻性追蹤時間平均為13.5年,世代中的所有成員都有罹患上消化道癌症的風險。因此,母群體發生上消化道癌症的風險可以通過世代研究進行估計——不僅能夠對整個母群體進行估計,也可以分別對有無飲酒行為的母群體進行估計。因此,前瞻性世代研究被認為能夠估計處於上消化道癌症風險的族群。
  
  能夠從前瞻性世代研究中估計具有風險的族群,從而能夠估計該族群中上消化道癌症的發病率或盛行率。它也能夠得到相對危險性(relative risk,RR),可以比較有無飲酒者罹患上消化道癌症的風險。相對風險(RR),只有處在風險族群可以估計的情況下才應該計算[3]。
  
  在伊朗北部進行的病例對照研究調查飲茶習慣與食道鱗狀細胞癌風險的關係。從這項研究中不可能估計具有罹患食管癌風險族群。研究設計根據疾病狀況選擇兩組——食管癌患者(病例組)和其他健康人群(對照組)。然後,研究人員就患者和對照組過去的飲茶習慣進行調查。病例組和對照組的樣本數,及二組樣本數的比(ratio),均由研究人員事先決定。因此,食道癌患者在整體樣本的比例就無法推論到其在母群體中的比例。此外,在自我報告危險行為——喝熱茶——的研究參與者中,罹患食道癌的比例取決於所選擇的病例數和對照數。這也適用於那些喝溫茶的研究參與者。
  
  由於無法從病例照研究中估計處於食道癌風險族群,因此不可能推導出飲用熱茶與溫茶的食道癌相對危險性。然而,在特定條件下,勝算比(odds ratio)——是母群體RR估計值——必須從樣本計算。在罕見疾病(盛行率通常被認為<10%),勝算比[4]被認為是對母群體相對危險性的一個良好估計值。可以用簡單的數學來證明。
    
Reference:
[1] Islami F, Pourshams A, Nasrollahzadeh D, Kamangar F, Fahimi S, Shakeri R, et al. Tea drinking habits and oesophageal cancer in a high risk area in northern Iran: population based case-control study. BMJ 2009;338:b929.
[2] Grønbæk M, Becker U, Johansen D, Tønnesen H, Jensen G, Sørensen TIA. Population based cohort study of the association between alcohol intake and cancer of the upper digestive tract. BMJ 1998;317:844-8.
[3] Sedgwick P, Marston L. Relative risks. BMJ 2012;341:c3983.
[4] Sedgwick P, Marston L. Odds ratios. BMJ 2010;341:c4414.
Cite this as: BMJ 2012;345:e6859

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。