誰是診斷更準確的急診室醫生？哈佛研究 AI 表現竟超越人類

哈佛醫學院和旗下貝斯以色列女執事醫療中心（Beth Israel Deaconess Medical Center，BIDMC）團隊發現，人工智慧（AI）對急診室診斷準確性，至少某些情況超過醫生。論文剛發表於《科學》期刊，研究員進行一系列實驗，評估 OpenAI 模型與醫生的表現。

研究員比較76名進入貝斯以色列急診室的患者，給兩位主治醫生與OpenAI ChatGPT o1 / 4o模型診斷後的結果。結論由另兩位主治醫生評估，他們不知道哪些診斷來自人類或AI。

每個診斷接觸點，o1模型表現竟比醫生略好或與醫生相當，尤其是初步分診時，o1模型表現更突出，67%案例做出「完全或非常接近的診斷」，一位醫生準確率為55%，另一位為50%。

儘管結果顯示AI某些情形頗有潛力，但研究員強調，AI尚未準備好急診室做出生死攸關的決策。他們呼籲進行前瞻性實驗，以評估新技術於實際護理環境如何應用。

此外，研究者指出，只研究提供文字訊息時的模型表現，且現有研究顯示，當面對非文字輸入時，目前基礎模型推理力仍很有限。共同資深作者亞當‧羅德曼（Adam Rodman）醫生表示，目前對AI診斷的責任並沒有正式框架，人類仍是評估績效與安全性的終極基準。

（首圖來源：AI）

理財