台灣淪爲肺葉切除王國的回響──與高志文老師商榷
聲明:筆者僅誠實表達閱讀完該文的疑惑,並認為妥善的討論對避免民眾恐慌是至關重要的,冒犯之處,還請原作者原諒。
在上篇針對台灣淪爲肺葉切除王國(上)的回文中,筆者提到數據牽一髮而動全 身,只要低劑量電腦輻射的副作用、價格等稍有變化,就會導致此政策的可行性全盤改變;筆者同時也預測了這場口水戰必然淪為對數據的打磨。同時身為具執照的醫師與公衛小種子(筆者為學生,不敢自稱公衛人),對於兩造論點均有涉略,醫界對於系爭文章中最大的不滿點就是「將所有類型的肺葉手術不論切除範圍,一視同仁」,如此行為就像把剪指甲視為截肢手術一般;光是切肺手術便包含楔形、結段、肺葉與全肺切除術,怎麼能夠直接將他們未加權的相加呢?然而,醫界自有其辯護,今天,筆者希望針對流行病學的 觀點多做些分析。
首先,系爭文章表示,「即便約 22000 人接受手術…自 2004 年至 2022 年,非吸煙女性晚期肺癌發生率仍維持在每十萬人18.7 例」,作者認為肺葉切除能攔截肺癌變為晚期,因此觀察晚期肺癌的粗發生率,即可驗證攔截是否有效應。然而,從時序性討論,既要討論因果,何以使用 2025 年接受手術的人數作為輸入,並使用 2004 年至 2022 年的發生率作為輸出呢?如此就是所謂使用未來預測過去吧?即便我們放寬解讀,認為作者所言輸入是指「近十年投入大量健保資源篩檢」,但,早期癌變為晚期,十年以上極為常見,換言之,作者等於使用橫斷資料推論需確立時序的因果鏈,這樣會造成嚴重偏差。此外, 攔截論的前提是肺癌的整體粗發生率「在反事實(counterfactual)框架下」不變,那麼當早期肺癌增加,晚期肺癌理應減少,但作者又何以證明在反事實框架下,台灣的肺癌事實上並沒有增加趨勢呢?近年空氣品質、生活習慣改變,民眾們都耳熟能詳,如果整體肺癌人數在上升,那麼即便早期肺癌人數上升,晚期肺癌人數也可能會持平,這反而代表了篩檢有極好的效果。另外,早期結節人數增加,晚期肺癌卻持平,如果肺癌事實上沒有增加趨勢,這豈不代表篩檢出來的人「全部都沒有癌症」?果真如此,這檢查應當會擁有零的陽性預測值(PPV)與零的敏感度(sensitivity),而且意外的成為一個很棒的工具:只要這個檢查 說你有結節,那你一定「沒有」癌症,這麼矛盾的情況,其實正說明了僅憑著攔截論去推理早期肺癌增加不合理,是有謬誤的。
再來,此系列文章看到現在,最特別的便是尚未提到「低劑量電腦斷層」造成的額外壞處;筆者認為作者肯定需要在最終章提及的。僅僅只是論證它「不是完全沒害」並不足夠;在筆者撰寫的上一篇文章中,該模型允許 LDCT 帶來一定比例的額外傷害,這需要跟減少癌症的貢獻(以及減少的末期病人住院、藥物等)去相比。作者原先假設減少癌症的貢獻不存在,於是只要論證 LDCT 有一丁點壞處,就可以證明推廣 LDCT 是不正義的,但筆者在上段已論述貢獻不存在的前提是不正確的。此外,作者對於 TALENT 研究一文 所提出的指摘,筆者也有些疑慮:作者將 TALENT 的基線實驗結果所刊登的期刊描述成「新期刊」,似有暗示該刊品質堪憂,並提出支持自己論點的文章均刊載在「頂尖期刊」,影響因子高達 21,卻對 TALENT 一文在追蹤期後刊登的期刊 The Lancet Respiratory Medicine 高達 32.8 的影響因子一事支字不提;另一「頂尖期刊」的文章則是作者多次揭露具合作關係的 welch 教授所撰寫。筆者並不以期刊指數論定文章的好壞,但當作者試圖訴諸選擇性揭露時,恐怕不適宜在這方面避重就輕。筆者也反對用同行的不同意見作為否定文章的依據;對事實錯誤的文章,Lancet 系列具有撤稿先例,作者已投書反對該文,既然未撤稿,那麼也就必須承認文章本身已受到期刊的被動認可。
針對TALENT一文作者的解讀,筆者也提出幾點疑問:
要求矛盾的隨機對照研究。TALENT 研究招募(幾乎)沒有吸菸史的志願者 (非常可能是醫院患者)接受LDCT 篩檢,並在其中發現部份的人肺部有異 狀。若要進行隨機對照研究,則我們必須招募一批志願者,不允許他們篩檢, 在一段時間後比較兩者間的肺癌發生率。但是,如果 LDCT 對吸煙者能夠增加 肺癌的檢出率,那麼,要求一批人絕不可以做篩檢,那反倒有違反 do no harm 的風險—明明有工具,為什麼不用?為什麼要預設 LDCT 還是個未驗證(nonestablished)的工具?這群人如果有人真得到肺癌,反過來怪罪實驗不准許其早期 發現,早期治療,那更是倫理悲劇。
對於肺癌定義的不正質疑。如同前方期刊的技巧,作者在描述 318 個確診癌症 者時,說他們是「健康、無症狀卻確診癌症的人」,似乎想表達連這 318 人的數 據都是大量的偽陽性。然而,肺癌分期有其標準定義,TALENT 使用的是 AJCC 第八版的分類,這 318 個人就是紮實的在檢查介入下,能夠找到的癌症人數。(註:由於筆者師承哈佛體系,使用反事實框架,這邊必須稍微說明一下以齊平認知。若要討論檢查(A)有沒有效果,我們理論上需要知道「如果全體都接受這個檢查(A=1),確診人數(Y[A=1])」減去「如果全體都不接受這個檢查(A=0),確認人數(Y[A=0])」的差值,而稱為反事實就是因爲每個個體都只能處在一個 狀態,我們無法知道一個人有沒有接受檢查,分別會是什麼處境。)作者其實真正質疑的是,即便不做 LDCT,我們搞不好仍然能夠抓到 300多人,但關鍵是這是無法論證的,因為我們不知道這 318 人若沒接受檢查,是否還是會被抓到肺癌?當然,透過可交換性(exchangeability)與一致性 (consistency),我們可以比較兩組不同的人,用以代替相同的人的兩個平行時空,只是,一來,這樣的研究在已知 LDCT 可能有效下,是否道德?二來,當使用隨機對照研究時,就必須確保這兩組人異質性不能過高(例如,不能一組都很老,一組都是男的),而這就是更多作者論點有欠周詳的領域了。
對於發生率比較的錯置。作者表示,在 TALENT 的受試者中,肺癌的檢出率高 達 2.1%,並比較其他「權威的外國研究」,指出 TALENT 認為台灣的無風險人口的盛行率竟是外國高風險人群的 2 倍。這是嚴重的概念混淆,TALENT 並非隨機對照實驗,受試者是邀請制,代表這樣本有選擇偏誤(selection bias),怎麼 能夠拿這個樣本的檢出率代表 TALENT 判斷的癌症發生率呢?眾所皆知,受試者來自各大醫院,這類醫院長期回診者一般也都較為年長,因此 TALENT 實際 上可能本來就篩選出了一批慢性病纏身的人參加實驗。筆者希望是自己誤解了 作者的意思,因為這並不是進階的流行病學議題。
未考慮案例對照研究的篩選。TALENT 研究雖然沒有對照組,但是卻針對家族史的有無做了 1:1 篩選,這代表理論上僅有勝算比(odds ratio)是不偏的,分析樣本中的盛行率是沒有意義的。由樣本數來看,只有家族史的正反兩方達到 1:1 的水平,足以證明其作為主要分析的地位(primary analysis),其他要素則都因為 癌症本來就少(rare outcome),加上樣本分佈不均而降低了檢定力。舉例而言,作者質疑均未達到顯著的各個危險因子裡,關於「有家族史、煮飯有無開抽風 機」這項,其正面選項只有兩人,勝算比是 0.90;倘若剛好少一個人回答是, 那麼勝算比會直接崩跌到 0.45,這樣的情況並不能拿來佐證作者所謂「該是危 險因子的都沒找到,代表樣本有問題」云云。這是因為,家族史既已佔據主要 分析,樣本設計都是為了最佳化其效果而設計,那麼其他項不顯著的機會自然 也提升了。
- 未考慮 OR 在連續型變項正確的解讀。延續上一點,作者指出年齡應當要隨著其增長而大幅增高肺癌風險,樣本卻未展現出這點,再次佐證樣本有問題。的確,根據 TALENT 原文,「The risk factors for overall lung cancer…age older than 60 years old (1.03, [1.01-1.05])」,60 歲以上受試者的發病風險只有 60 歲以下的 1.03 倍。然而,觀察左側的原始數據,我們會發現 Odds ratio 算起來大約是 1.08 左右,並非 1.03,也不是單變數分析的 1.01;類似現象也發生在 BMI 這類連續型變數,二元變數卻大致是精準的。這說明 OR 可能誤植了,1.01 代表「年齡每增加 1,得病的勝算增加 1%」,而不是 60 歲以上(age=1)相較 60 歲以下(age=0),得病勝算增加 1%。這的確是原文誤植,但作者不可能沒注意到這個奇怪之 處,若只比較 60 歲與 61 歲的人是否得病機率有顯著差異,考慮到樣本規模, 得不出顯著結論也是很正常的。
未考慮家族史為基因的代理變量。筆者認為,作者的重要論點之一是將家族史 作為重要篩選標是不正確的,因為其勝算比只有 1.5~1.7 之間。然而,作者也承認家族史本身隱含多重概念:家族間共享一定比例的基因,這部分比較純粹;家族也可能繼承相若的社經地位、居住環境,這部分論證很複雜。若某家族流 傳肺癌基因,卻世代務農,遠離城市空污與香煙,兩者互相抵銷的結果便是受 到稀釋的勝算比,這並不是不可預見的結果。
目前,針對兩者關聯的中介分析研究尚不完備(相關工具為筆者所屬機構開發 中所謂「跨性狀全基因關聯分析(cross-phenotype genomic association study)」, 但,考量到對全體民眾做全基因定序並不現實,使用其他方法作為基因成分的 代理人,實務上有其合理性,而家族史的確是其中最好的變量,不能因為家族 史不是基因完整的代言人(proxy)就直接否定其合理性。
對於現有基因研究的質疑。作者提出,由於 EGFR 屬於體染色體遺傳,因此時 序滯後,我們不能說「亞洲女性有較多 EGFR 變異」。然而,如果亞洲女性的腫瘤的確有較高比例的 EGFR 變異,那麼這是否代表亞洲女性的基因較容易透過某類未知的路徑誘發腫瘤產生 EGFR 變異呢?對於單憑 EGFR 屬於體染色體遺傳,而否定了其他醫界學者認為基因可能導致特定人種腫瘤粗發生率較高的假說,並不是充分的論述。
回顧本文,作者的確有提出許多合理的論述,例如篩檢會製造自我實現的風險因子,提升陽性檢出,但是,所有陽性的人,都直接被抓去動刀了嗎(作者質疑對於指引的遵從性,這點筆者不予評論)?沒檢查出的人,有白挨檢查嗎(作者需要提供對 LDCT 負面效 應的分析)?就算 LDCT 不是完全無害,它帶來的好處是否大於壞處?這些都是非常重要,需要被回答的問題;早在筆者的第一篇文業已提及。若迴避此項,僅針對數據解讀不斷深掘(且同時解讀具有疑慮),那麼恐難說服醫界與民眾,只會給民眾投下不信任彈。
※作者為哈佛大學臨床流行病學碩士在讀、Broad Institute of MIT and Harvard 研究實習生。