火柴與肺癌

流行病學界流傳一個不太好笑的冷笑話,真實性不詳,但卻傳之不絕,可成為引以為戒的案例。

據說,在二十世紀早期,曾有人發現火柴與肺癌有關聯,因為時常用帶火柴出街的人,較易有肺癌。故此火柴可能引致肺癌。

這個笑話就此完結。如果你 get 不到笑點在那裡,我也不妨畫公仔畫出腸。火柴只是一個 label ,實在的原因是,帶火柴出街的大多是吸煙人士,而吸煙是可以引致肺癌。故此,火柴及肺癌的關係之間,存在一個 confounding factor ,就是吸煙。假如我們找一群沒有吸煙,但是卻天天帶火柴出街甚至天天劃火柴的人,會發現他們並不會較易有肺癌。 Confounding factor 的定義是,它同時與 exposure 及 outcome 相關,故此會影響 exposure 及 outcome 的關係。
好了,至於為何突然找回這個案例,當然是有原因的。

塑化劑風暴 黃偵潔:若是這樣罹癌,我很不甘心

她(黃偵潔)說,7年前因便祕問題就診,在診所發現德康生技公司生產的「通暢包酵素飲品」廣告,在醫師介紹下試用效果不錯,後來向廠商直接訂購整箱,她的姊姊也有服用,但吃的時間較短。她強調,平時不吃油炸食物,口味也不重,作息正常,除通暢包外沒吃其他藥物或營養品。

陳政聞表示,妻子去年7月生產,除懷孕期間停用外,7年來長期服用該項產品,產後也繼續服用。2週前妻子發現左咽喉有2顆腫瘤,就醫切片檢驗發現是大腸癌末期轉移,癌細胞還轉移到肺、肝與淋巴結,目前正接受化療。他指出,他們不打算訴諸法律求償,只要求有關單位釐清這項產品是否為罹癌元凶。

應用以上的火柴與肺癌事例,你可以看出這個新聞的玄機嗎?
本人對於黃偵潔的遭遇深感同情,我也不是指出「黑心起雲劑」1 沒有問題,但是她的指控實在難以成立。
假如 exposure 是含有「黑心起雲劑」的「通暢包酵素飲品」,而 outcome 是大腸癌 ( Colorectal Cancer)。中間就有一個巨大的 confounding factor ,就是她七年服用通便產品都解決不了的便秘問題,間接也反映出她的飲食習慣。除了「平時不吃油炸食物,口味也不重,作息正常,除通暢包外沒吃其他藥物或營養品」,她也應該少吃蘊含維生素及食用纖維的蔬果。
眾所周知,便秘是大腸癌的高危因素,甚至可以是大腸癌的病徵之一。沒有便秘的話,是不會去食用「通暢包」。
再者,「黑心起雲劑」 的污染物 DEHP 是仿雌激素,主要的討論點是干擾內分泌系統,例如男性的性器官縮小。在動物實驗中的確證明是可以致癌,但只會增加患上肝癌的風險,而不是大腸癌。
如果用流行病學的語言,黃偵潔的遭遇可以說成是: Her colorectal cancer is more likely to be attributable to persistent constipation rather than consumption of DEHP contaminant in health supplement.

  1. 起雲劑一詞,我想是來自台灣的。香港多是譯成乳化劑。 []

別當讓你的流行病學還給教授們

流行病學及生物統計學是我的專長。其他的東西我不敢去認是專長,但這兩個我敢去認,除了是我以他們為生,每天都應用到之外,我亦落力的去鑽研。就算這兩個科目的搵食能力非常之弱,我亦對這兩科有濃厚興趣。
流行病學及生物統計學是公共衛生的核心科目,是公共衛生研究的基礎,每一個讀公共衛生的,或多或少都讀過這兩科。1 生物統計學由於是一門技術科目,很多人都不會忘記。但是,流行病學卻有嚴重「吹水」成份,這類科目很易還給教授們。2 讀過流行病學,但是卻還給教授們,是多麼的浪費。
有時都想問自己,到底流行病學讀過甚麼。除了那些計 Risk, Relative Risk, Odds ratio, ARF, direct/indirect standardization 之類的數字,還有不同的 study design 及其優劣之外,其實流行病學近乎全部的知識,只環撓三個 keywords。在說出來之前,不妨考下自己,到底是那三個?那三個 keywords ,理論上是每一個流行病學學生,不用思考隨口嗡都可以講出來的。

好了,想不出來了吧。開古了。

Bias, Confounding, Chance3

這三點是甚麼?這三點是 Threats to study validity
如果你有意重溫流行病學,又或者你是 current 的流行病學學生,不妨以這個匣架將自己的認識組織起來4 ,方會發現流行病學並不止是一個吹水科目,而是一個事事講求 study validity 的科目。另外,在進行研究論文的嚴格判讀 ( critical appraisal ) 時,也可用這個匣架將某研究潛在問題列舉出來。

  1. Sorry ,我是沒有真正讀過公共衛生,我只讀過流行病學及生物統計學 []
  2. 我之前也讀過 Biotechnology ,但是除了可以在行山時講下植物類型或者地衣是甚麼之外,我想這個方面已經全還了。 []
  3. 或稱 random variation []
  4. 例如不同的 source ,不同的研究類型會較易有那種 threat ,以及研究設計時避免及數據分析時的補救方法。 []

陰性愛滋病與 Casuality

國內鍾南山教授的研究結論,如報載,如下:

鍾南山昨日在廣州醫學院第一附屬醫院會見傳媒,他和該院專家組成的專題研究小組從3月開始,對62名自稱患有「陰性愛滋病」的患者進行全面身體檢查。「我不同意用『陰性愛滋病』這一名稱」,鍾南山強調,病症與引致愛滋病的HIV病毒完全無關,但驗出有其他多種病毒及病原體,其中33人驗有EB病毒……
鍾南山解釋,上述病毒都是已知的,並無什麼「神秘病毒」,部分經過針對治療之後已有好轉。EB病毒俗稱「接吻病」,症狀包括乏力、頭痛、淋巴結腫大、皮疹等,通過口水可以傳染,呼籲無論在家或公共場所都要使用公筷。呼吸疾病國家重點實驗室研究員周榮說,上述病毒傳染人後,在白細胞中「固化」而轉成長期慢性病,之後便沒有傳染性。

這個結論,基本上與以下論調類似:陳電鋸研究了一百名自稱患有「陰性愛滋病」的患者,發現五十人為男性,故此「陰性愛滋病」的病原體是 Y 染色體。
我並不是指「陰性愛滋病」的病源體並非 EB 病毒,我並沒有數據。但從循證醫學的角度來看,鍾南山教授的研究並不足以指出所謂「陰性愛滋病」之病原體為何。1
首先,這是一個 case series 。更加合理的做法,是另找一群社會位勢類似,生活環境類近,而又自稱沒有患上「陰性愛滋病」的對照組,同樣進行微生物學檢查。假如對照組感染 EB 病毒的比率很底的話,才可以對照出「陰性愛滋病」之 EB 病毒感染率高。就算是這樣,也只是證明 EB 病毒與所謂「陰性愛滋病」有關,但並不代表 EB 病毒引致「陰性愛滋病」。如果要證明 EB 病毒引致「陰性愛滋病」,最小要都要有傳統的柯霍氏法則( Koch’s postulates )檢定。

  1. 證明病原體 ( EB 病毒) 可常在患者身上找到,健康個體較少
  2. 從患者身上抽取的病原體 ( EB 病毒) 可於培養液中培養,並可紀錄其微生物特徵
  3. 培養出來的病原體 ( EB 病毒) ,接種至健康個體(或實驗動物),會產生同樣的病癥
  4. 從接種的個體(或實驗動物)再抽取的病原體 ( EB 病毒) ,再在培養液中培養,其微生物特徵與原來一樣,而且再接種另一個體,會同樣致病

從那一個角度看,也看不出鍾氏的結論合乎以上的柯霍氏法則。
根據世衛的數據, 95% 的人類曾感染 EB 病毒,並會成為終身帶毒者。故此,62 名「陰性愛滋病」患者有 33 人感染 EB 病毒,根本不是甚麼驚天動地的發現。反而鍾氏指出全部 62 名「陰性愛滋病」都沒有找出人類免疫缺陷病毒( HIV )。才是重要的發現。2

  1. 另一篇 comment 。 []
  2. 但當然, HIV 是有潛伏期的。 Viral load 太底可能查不出來。 []

Retrospective case series

我的 research 生涯,做得最多的研究類型是 Retrospective case series (RCS, 也稱為 Chart review ) , Prospective 的反而不多。
RCS 有其限制,但是 Clinicians 們卻以為 RCS 是平靚正的選擇,以為 reviewer 見到其 sample size 夠大就會刊登。
多年來,已經知道怎樣才能將 RCS 做好寫好,而且送到「較佳」期刊刊登的法門。講真,期刊連 Randomized Controlled Trial 甚至 Systematic Review 都要 Reject 的時侯,為何要刊登你的 RCS ?你有甚麼新鮮蘿蔔皮?
但是,醫生從來不相信我的一套 Theory 。但是他們是主宰我出糧,他們說甚麼,我已經不太想去堅持己見。 I’m sick and tired of correcting people.
當我可以更加自由地 apply 這套 theory 時,成品多數更加美觀(elegant),更有機會獲得期刊的接納。反而任何 bossy 人物突入「要乜要物」,結果多數是 half-baked cake ,根本就不能完成。就算完成,樣貌不美觀之餘,行文更加是自掘墳墓。這些東西的最終歸宿通常是不知道有否進行 peer reviewed 、沒有人看的本地學會期刊。
如果你相信我,以下是 RCS 非常阿媽係女人的所謂教訓,是一個老屎忽但長年低級的「研究助理」經年累積下來的經驗。

清楚你的 outcome 及 exposure

腦中沒有 outcome and exposure ,這個 study 即是沒有任何 hypothesis ,是為找 data 而找 data ,單單給人這樣的 impression ,這個 study 已經是死梗的了。看看 local journal 或者大陸 Journal ,最常見就是這類為找而找的 study 。這類研究的標題十之有九是:

Clinical characteristics of foobar patients admitted to the foorbar hospital: a n-year retrospective review

N-year experience with foobar diseases in n hospitals in Hong Kong

這類「研究」更正確的學名是 audit ,而 audit 從來都不是 science 。這些所謂 study 會標榜自己是 prevalence / descriptive study 去隱藏自己為找 data 而找 data 的事實,但學過實驗設計 101 的都知道 Prevalence 並不能用 Retrospective study 求出來的。

中小學學過的科學方法說明:

1,Define the question
2.Gather information and resources (observe)
3.Form hypothesis
4.Perform experiment and collect data
5.Analyze data
6.Interpret data and draw conclusions that serve as a starting point for new hypothesis
7.Publish results
8.Retest (frequently done by other scientists)

RCS 是有點不同的, Observation 及 routine data collection 是已經做了。但是卻沒有 Research Question 及 Hypothesis 。沒有 Hypothesis 的「研究」,不是 science 。
當然,亦有另一個 extreme ,就是有一批沒有整理的 clinical data ,卻要驗證九百條 research questions 及 hypotheses ,渴望求其扑中一題。這是研究專案變成 half-baked cake 的決定性心態。驗證九百個 hypotheses ,就要 collect 最少一百種的 outcome/exposure 關係了吧。先不談人力物力的 practicality 問題,講到明是 RETROSPECTIVE ,原始數據是已經寫了在 medical record (俗稱「牌版」),「牌版」上寫了幾多,你所有的數據就有幾多。愈增加 variables 數量,就更加大機會有 missing data 。1 Retrospective 加 missing data ,我對這個研究的喜愛就大打折扣,這是 reviewer 的常識。問題是你的 study 如果又 retrospective 又 missing data ,又同你三唔識七,我為何要原諒你?2
所以我的建議,是非常阿媽係女人的: one exposure, one outcome.
就算是要增加,只可以增加 exposure 的數目,而且最好不要多於三款。夠晒的了。
舉個例:

The Correlation Among Obesity, Apnea-Hypopnea Index, and Tonsil Size in Children.

這個 study 如果不根據以上經驗進行,就會變成 The clinical characteristics of patients admitted to sleep laboratory: a 10-years retrospective review. 屆時就真是牛頭角村村長個女-「李愛」了。
單看 title 就清楚,只有兩個 exposure ,就是 obesity 及 Tonsil size 。 outcome 只有一個,就是 apnea-hypopnea index 。要解答的問題就是三者的關係,並不是為找 data 而找 data 。真真正正找 data 時, dataset 只有少於十個 variable 。簡單清爽。

Inclusion / exclusion criteria

另一個常見的問題,是行文中見到此 study 有 600 個 subjects ,很大的 sample size 喎。但是某一個 exposure 的數據,只有 100 個 subjects 有紀錄。另一個 outcome 數據,只有 40 個 subjects 有紀錄。故此,在分析時,只有這 100 人及 40 人有份被分析。
這是自掘墳墓。在我當 Reviewer 時,簡直是覺得這篇 paper 在時刻提點我 RCS 的最大缺點。
這一點是與以上一點有關的。要是你只有一兩款的 exposure 、一款的 outcome ,根本不會出現這個問題。假如你只有一兩款 exposure 及一款 outcome 都這樣甩甩漏漏的話,根本代表你的 data 並不適合用於驗證你的 hypothesis 。
我通常會將其中一個 inclusion criteria 設定在有進行 exposure/outcome 的 test ,而且有數據的 subject 。這樣就可以保證有 complete data 。這樣當然可能有 selection bias 的問題。但是你納入來的 subject 連 exposure/outcome 的數據都沒有,請問你在做甚麼研究?再者,你講到明是 Retrospective 的研究,就從來沒有人要求你的 sample 是要 100% representative of the population 。
這也引申另一個問題。
例如某研究的 outcome 是 drug compliance 。「牌版」上未必會找到 drug compliance 的字眼。這個時侯就會有 bossy 人士跳入來,問為何不致電病人問返他的 drug compliance ?這樣的結果,就會總人數 N 個病人,有 y 個病人由於「牌版」上沒有 compliance ,是致電問的。另有 N – y 人是看「牌版」得知的。我做 reviewer 的時候,就會問以上 y 的數目,並要求研究人員做 sensitivity analysis 。即是代表:我對你的數據毫無信心。
Measurement 的簡單要求,是同一個 outcome 不應用兩個不同的方法收集。例如要計算人類體溫的正常值,你也不能有些人量耳溫、有些人肛探、有些人用紅外線探熱針、有些人用水銀。但當去了 RCS 的範團,人們就覺得這樣做是理所當然。
在 RCS ,要是某個 variable 是用兩個不同的方法收集,你有責任證明兩者的 agreement 。但是要證明「牌版」上的紀錄和致電詢問的 agreement ,等於自殺,再次提點 reviewer RCS 的缺點,就是你的「牌版」根本不可靠。

Hypothesis generation, no clinical recommendation

由於 RCS 沒有 randomization , confounding variables 的控制也差,所以有以下的缺點:

1. 不能證明 exposure 及 outcome 的先後次序
2. 不能保證 exposure 及 outcome 的關係有 confounding variable 影響
3. Past may not (always) predict the future

故此,不單止不能確立任何的 causal relationship ,更加不能「證實」任何 hypothesis 。所以,任何的 RCS 目的只能夠是 hypothesis-generating ,並由未來的 prospective study 證明之。故此,在 discussion 除了要不停數落 RCS 之缺點之外,也要明確聲明研究的任何結果都要由 prospective study 驗證。
有些人又真的以為自己個 RCS 有甚麼新鮮蘿蔔皮,在 discussion 狂寫因應此一研究的結果,臨床應該要有甚麼甚麼的轉變。這個又是另一死罪,是 egomaniacs 的死罪。
現實的情況是,就算 Systematic Review 及 RCT ,都並不一定可以提供任何臨床建議,屬於 observational study 的 RCS 更加不可以提供任何臨床建議。「更年期女士的 hormone replacement therapy 醫心臟病」3 或「疫苗引致自閉症」4 的經典公共衛生災難案例,已經寫在流行病學的書藉。但是災難永遠都會重演的,這就是因為臨床人員的自大和狂莽。

  1. 你知道醫生們寫「牌版」通常寫得「好清楚」的。 []
  2. 這解釋了為何這些 study 見諸於 local journal ,就是因為研究人員及 reviewer 並不是三唔識七。 []
  3. Observational study 發現接受 HRT 的婦女心臟較健康,認為是一個 prophylaxis 。於是乎美國醫生大力建議女士更年期後接受 HRT 。但是臨床卻發現接受 HRT 的女性,心臟健康更差。後來的 RCT 也發現 HRT 會令心臟健康差。原來是因為原來的 observational study ,進行 HRT 醫療保險不能 claim 錢。於是乎接受 HRT 的女性都是較為有錢,有錢人就較為緊張自己的健康,當然心臟健康會較好。當做 RCT 時,平衡了 Socioeconomic status 的影響, HRT 破壞心臟的真相才浮現出來。 []
  4. 之前已經寫過 Andrew Wakefield 案。 []