跳到主要內容
實證庫 Evidence Lab

替代指標 vs 真正終點:「數字降了」不一定「救了命」

血壓、血糖、膽固醇降了,腫瘤縮了,不等於更少心梗、更長壽命。學會追問「真正終點」改善了沒。

證據等級:專家意見 / 共識 — 經驗判斷,證據強度較低

一句話結論:「某個數字變好看」不等於「病人變好」。 血壓、血糖、膽固醇降了,腫瘤縮了,這些都是「替代指標」;你真正在乎的——少一次心肌梗塞、少一次中風、活得更久、活得更舒服——才是「真正的終點」。兩者常常一致,但不保證一致。歷史上有藥物把替代指標壓得漂漂亮亮,卻反而害死更多人。所以面對任何「能降低 X」的宣稱,學會多問一句:那個你真正在乎的結果,到底改善了沒有?

替代指標與硬終點,差在哪

**硬終點(hard endpoint)**是病人能直接感受、真正重要的結果:心肌梗塞、中風、住院、死亡、生活品質。**替代指標(surrogate endpoint)**則是「被認為能預測那個結果」的中間標記——血壓、血糖(HbA1c)、低密度膽固醇、腫瘤大小、骨密度數值。

FDA 給替代指標的定義很直白:它是「一個被認為能預測臨床效益、但本身並非臨床效益本身的標記(a marker… that is thought to predict clinical benefit but is not itself a measure of clinical benefit)」。(FDA, Accelerated Approval Program)

為什麼大家愛用替代指標?因為硬終點太貴、太慢。要證明一個藥「減少死亡」,你可能得收上萬人、追蹤好幾年;但量血壓、抽血看膽固醇,幾週就有數字。替代指標是研究的捷徑——它本身沒有錯,錯的是把「捷徑」當成「終點」。

經典反例:CAST 試驗——心律壓住了,人卻死更多

最有名、也最該被記住的反例,是 1980 年代末的 CAST(Cardiac Arrhythmia Suppression Trial,心律不整抑制試驗)

當時的推理聽起來天衣無縫:心肌梗塞後常出現心室早期收縮(一種心律不整),而心律不整與猝死有關;既然有藥(encainide、flecainide)能有效「壓住」心律不整這個替代指標,那它應該也能減少猝死才對。

結果完全相反。發表於《新英格蘭醫學期刊》1991 年的 CAST 結果顯示:這些藥確實成功抑制了心律不整,全因死亡率卻不降反升。 服藥組的全因死亡率約 8.3%、安慰劑組約 3.5%,相對風險約 2.4 倍;其中「心律不整造成的死亡或心臟驟停」服藥組約 5.7%、安慰劑組約 2.2%,相對風險約 2.6 倍。試驗因為藥物明顯有害而提前中止。(CAST, NEJM, 1991)

這就是替代指標的致命陷阱:藥物在「心電圖上的心律不整」這個替代指標上贏了,卻在「人有沒有活下來」這個真正終點上輸了——而且輸得很慘。[已知] 壓住了一個你以為的「壞東西」,不代表你救了命。

腫瘤縮小 ≠ 活得更久

癌症治療裡也有同樣的故事。常見的替代指標是「腫瘤反應率(腫瘤縮小的比例)」或「無惡化存活期」,而病人真正在乎的硬終點是「整體存活(活多久)」與生活品質。

直覺上,腫瘤縮小應該等於活更久。但 2020 年《British Journal of Cancer》一篇涵蓋 63 項研究、橫跨 20 種癌別的系統性回顧發現:腫瘤反應指標(如客觀反應率 ORR、完全反應 CR)與無惡化存活或整體存活之間的關聯,在不同研究之間差異很大、缺乏一致規律,而且反應率與「整體存活」的關聯,比它與「無惡化存活」的關聯更弱、更不穩定。作者的結論是:這類反應型指標「可能不是無惡化存活或整體存活的可靠替代指標」。(BJC, 2020)

換句話說,「腫瘤縮小了」是好消息,但它不自動翻譯成「你會活更久」。這也是為什麼一個誠實的腫瘤科討論,會把腫瘤大小和存活、生活品質分開來談。

那 FDA 為什麼還容許用替代指標核准藥物

這正是「加速核准(Accelerated Approval)」的設計。對嚴重疾病、又有未被滿足醫療需求的情況,FDA 允許藥物先憑一個「合理可能預測臨床效益(reasonably likely to predict clinical benefit)」的替代指標核准,好讓病人早點用到藥。(FDA, Accelerated Approval Program)

但關鍵在於——這不是免死金牌。加速核准之後,藥廠仍被要求進行**確認性試驗(confirmatory trial)**去驗證真正的臨床效益;唯有確認試驗證實效益,該核准才算站穩。(FDA, Accelerated Approval Program) FDA 甚至公開維護一份「曾作為核准依據的替代指標清單」,把哪些指標被用過攤在陽光下。(FDA, Table of Surrogate Endpoints) 制度本身就承認:替代指標是「先借用」,硬終點才是「最終要還的帳」。

我的觀點

[已知] 替代指標不是壞東西,它讓研究在合理時間內做得出來,沒有它,很多藥根本來不及問世。問題從來不是「用了替代指標」,而是「把替代指標的好看,直接當成硬終點的勝利」。CAST 與那篇癌症系統性回顧,講的是同一件事:兩者之間的橋,有時候是斷的。

[推測] 我會這樣看一則健康宣稱:先分辨它講的數字是「替代」還是「真正終點」。如果只看到「降低血壓 X」「腫瘤縮小 Y%」「血糖改善 Z」,而完全沒提心梗、中風、死亡或生活品質,我會把它當成「有潛力、但還沒被證實」,而不是「已經救命」。這個推論的依據是:歷史上替代指標與硬終點脫鉤的案例夠多,足以讓「沒提硬終點」本身成為一個該警惕的訊號。

[不知道] 至於某個「特定藥、特定族群」的替代指標到底準不準,沒有單一通則能回答——那要看那個指標在那個疾病裡有沒有被確認性試驗驗證過。這正是該交給你的醫師、依你的實際狀況判斷的地方,而不是靠一句漂亮的標題。

實用的一招:聽到「這能讓你的某個數字變好」,就接一句「那我真正在乎的結果——會不會少生一次病、會不會活更久、會不會活得更舒服——有沒有變好?」這句話,往往就是科普標題與真實療效之間的分水嶺。

本文為健康資訊與研究方法整理,不構成醫療建議。文中 CAST、癌症反應指標等案例各有其特定族群、疾病與試驗條件,不能直接套用到你個人或任何單一藥物上。是否使用、停用或調整任何藥物與治療,請與你的醫師或藥師依你的實際狀況討論,切勿自行更動。

資料來源

每一則主張都對應到下方原始來源。我們優先採用系統性回顧、臨床指引與隨機對照試驗。

  1. 1
    Accelerated Approval Program

    U.S. Food and Drug Administration (FDA)· 2024專家意見 / 共識查證於 2026年6月14日

  2. 2
    Table of Surrogate Endpoints That Were the Basis of Drug Approval or Licensure

    U.S. Food and Drug Administration (FDA)· 2024專家意見 / 共識查證於 2026年6月14日

  3. 3
    Mortality and Morbidity in Patients Receiving Encainide, Flecainide, or Placebo: The Cardiac Arrhythmia Suppression Trial

    New England Journal of Medicine· 1991隨機對照試驗(RCT)查證於 2026年6月14日

  4. 4

常見問題

什麼是替代指標(surrogate endpoint)?

替代指標是一個「被認為能預測臨床效益、但本身不是臨床效益」的標記,例如檢驗數值、影像、體徵。FDA 的定義就是「a marker… that is thought to predict clinical benefit but is not itself a measure of clinical benefit」。相對地,硬終點(hard endpoint)是病人真正在乎、可直接感受的結果,例如心肌梗塞、中風、死亡、能不能正常生活。

既然替代指標不可靠,為什麼研究和藥廠還一直用?

因為硬終點往往要等很久、需要很大的樣本與很長的追蹤——例如要觀察「死亡」可能得追蹤好幾年、收上萬人。替代指標(血壓、血糖、腫瘤大小)幾週到幾個月就能測到,省時間也省成本。它不是沒用,而是「方便的近似」;問題出在把「近似」當成「等於」。

「合理可能預測效益」的替代指標通過核准後,會怎麼把關?

[已知] 以 FDA 加速核准為例,藥廠仍被要求進行確認性試驗,去驗證藥物是否真的帶來預期的臨床效益;若確認試驗證實效益,FDA 通常會解除該要求。換句話說,加速核准是「先放行、後驗證」,不是「永遠不用看硬終點」。