發表偏差:為什麼「沒效果」的研究你常常看不到
正面結果較容易被發表、被引用、被報導,null 結果被壓在抽屜裡。這會讓統合分析高估療效——怎麼偵測、怎麼對抗。
先講結論:你在新聞、論文引用、甚至教科書裡看到的研究,並不是一個「中立的隨機樣本」。有效、漂亮、達到統計顯著的研究,比較容易被發表、被快速發表、被引用、被媒體放大;做出來「沒效果」的研究,則常常被研究者收進抽屜、never 公開。這個系統性的篩選,就叫發表偏差(publication bias)——它最危險的地方不是某一篇造假,而是讓你看到的「整體證據」本身就偏甜。
抽屜問題:消失的 null 結果
Cochrane 系統性回顧手冊第 13 章把這件事講得很清楚。所謂「非報告偏差」,是指關於要不要、何時、在哪裡報告一份研究結果的決定,受到了結果的 P 值、效果大小或方向的影響。它的具體表現是:統計顯著的結果,比起不顯著的結果,更容易被取得、被快速取得、登上高影響期刊、也更常被別人引用。
倒過來看就是「抽屜問題」(file drawer problem):一份試驗辛苦做完,結果不顯著,研究者覺得「投了也不會上」,於是把資料收進抽屜,外界永遠不知道它存在過。問題在於——沒效果,本身就是重要的資訊。 它消失了,剩下的就只有報喜不報憂的那一半。
這不是猜測,有數字
發表偏差不是學界的都市傳說。Hopewell 等人 2009 年一份 Cochrane 方法學回顧(編號 MR000006)彙整了實證研究後得出:正面結果的試驗被發表的勝算,約是負面或無效試驗的 3.9 倍(odds ratio 3.90;95% 信賴區間 2.68 到 5.68)。
不只「會不會發表」,連「多快發表」都有差。同一份回顧指出,正面結果的試驗大約 4 到 5 年就發表,負面結果的試驗卻要拖到 6 到 8 年。 也就是說,在某個療法剛紅、大家最想知道答案的那幾年,檯面上能看到的證據,是被正面結果「搶先卡位」過的。
它怎麼讓統合分析高估療效
統合分析(meta-analysis)被視為證據金字塔的頂層,因為它把很多研究彙整成一個結論。但它有一個前提:你找得到該找的研究。
當沒效果的小型研究普遍沒被發表、檢索不到,能被納入彙整的就偏向正面那一批。Cochrane 手冊明說,這種情況下,統合分析算出來的總估計值會「傾向高估介入效果」,高估的幅度取決於有多少、以及哪個方向的研究被漏掉了。換句話說,「一份統合分析說有效」也不是免死金牌——還要問它有沒有處理遺漏研究的問題。
漏斗圖:能提示、不能判決
那要怎麼偵測?最常見的工具是漏斗圖(funnel plot)。它是把各研究的效果估計值(橫軸),對著研究的大小或精確度(縱軸)畫成的散布圖。在沒有偏差時,圖形應該長得像一個對稱的倒漏斗:大型、精確的研究擠在頂端中央,小型研究在底部往兩邊散開。
如果圖形不對稱——例如底部某一側系統性地缺了一塊——就可能暗示有小型、不顯著的研究「沒被畫進來」。但這裡要非常小心:Cochrane 手冊明確警告,漏斗圖不對稱「不應被當成診斷依據」。不對稱也可能來自真實的異質性(不同次族群效果本來就不同)、小型研究的方法品質較差、或純粹機運。它是一條值得追查的線索,不是一張判決書。
怎麼對抗:把關卡移到「事前」
事後再來偵測,治標不治本。真正的解法是把關卡往前移到「還不知道結果」的時候。
- 試驗預先註冊。 像 ClinicalTrials.gov 這類試驗登錄系統,讓人能看到「啟動了、進行中、或已完成但不一定發表」的研究清單。美國 FDAAA 801 與其 Final Rule(42 CFR Part 11)更進一步要求符合條件的臨床試驗登錄,並回報結果摘要——這樣即使試驗沒發表成論文,它的存在與結果也有跡可循。Cochrane 手冊提到一種「起始世代(inception cohort)」做法:只納入登錄系統裡的試驗,就能對「哪些研究有/沒有結果」做完整盤點。
- 註冊報告(Registered Reports)。 這是 Center for Open Science 推動的發表格式,把審稿拆成兩階段:第一階段在收集資料之前,先就研究問題與方法審稿,通過就給「原則上接受(in-principle acceptance)」——只要照核可的計畫做,期刊就承諾刊登;第二階段才補上結果與討論。關鍵在於:第二階段不能因為結果不顯著、出乎意料或不討喜而被退稿。 從制度上斷了「報喜不報憂」的根。
我的觀點
[已知] 發表偏差的存在與方向,是有實證數字支撐的(前述 OR 3.90 那份 Cochrane 回顧),這點沒有爭議。[推測] 我認為對一般讀者而言,最實用的一條心法是:「一篇正面研究」不等於「整體證據」。 你看到的那篇漂亮研究,很可能正是因為它漂亮,才有機會出現在你面前;那些做了同樣的事、卻沒效果的研究,可能正安靜地躺在某個抽屜裡。
[已知] 所以判斷一個療法時,優先看「有處理發表偏差的系統性回顧」(會檢查漏斗圖、會去搜未發表資料、會盤點試驗登錄),勝過看任何單一篇正面報導。[不知道] 至於某個特定主題的證據究竟被高估了多少,沒有通用答案——那要看該領域有多少研究躺在抽屜、以及回顧者有多努力去把它們挖出來。但方向是確定的:檯面上的證據,預設是偏甜的。
本文為健康與研究方法資訊整理,目的在協助讀者理解「為什麼正面研究比較常見」這件事,不構成醫療建議,也不能取代專業判斷。任何治療決策請與你的醫師或合格醫療人員討論;評估特定療法時,建議優先參考有處理發表偏差的系統性回顧,而非單一篇正面研究或新聞報導。
資料來源
每一則主張都對應到下方原始來源。我們優先採用系統性回顧、臨床指引與隨機對照試驗。
- 1
- 2
- 3
- 4
常見問題
什麼是「抽屜問題」(file drawer problem)?
指做出來卻沒效果(統計不顯著)的研究,常被研究者收進抽屜、never 投稿,於是外界永遠看不到。Cochrane 手冊的講法是:統計顯著的結果比較容易被取得、被快速取得、登上高影響期刊、被別人引用——反過來說,null 結果就容易消失在檯面下。
發表偏差為什麼會讓統合分析高估療效?
[已知] 統合分析是把多篇研究彙整成一個總結論。如果「沒效果」的小型研究普遍沒被發表、找不到,那麼能被納入彙整的就偏向正面的那一批,算出來的總效果自然會比真實情況樂觀。Cochrane 手冊明說,這會讓總估計值「傾向高估介入效果」。
看到漏斗圖不對稱,就代表一定有發表偏差嗎?
[已知] 不是。Cochrane 手冊明確指出漏斗圖不對稱「不應被當成診斷依據」。不對稱也可能來自真實的異質性(不同次族群效果不同)、小型研究方法品質較差、或單純機運。它是「提示」,不是「判決」。