誰是診斷更準確的急診室醫生?哈佛研究 AI 表現竟超越人類
哈佛醫學院和旗下貝斯以色列女執事醫療中心(Beth Israel Deaconess Medical Center,BIDMC)團隊發現,人工智慧(AI)對急診室診斷準確性,至少某些情況超過醫生。論文剛發表於《科學》期刊,研究員進行一系列實驗,評估 OpenAI 模型與醫生的表現。
研究員比較76名進入貝斯以色列急診室的患者,給兩位主治醫生與OpenAI ChatGPT o1 / 4o模型診斷後的結果。結論由另兩位主治醫生評估,他們不知道哪些診斷來自人類或AI。
每個診斷接觸點,o1模型表現竟比醫生略好或與醫生相當,尤其是初步分診時,o1模型表現更突出,67%案例做出「完全或非常接近的診斷」,一位醫生準確率為55%,另一位為50%。
儘管結果顯示AI某些情形頗有潛力,但研究員強調,AI尚未準備好急診室做出生死攸關的決策。他們呼籲進行前瞻性實驗,以評估新技術於實際護理環境如何應用。
此外,研究者指出,只研究提供文字訊息時的模型表現,且現有研究顯示,當面對非文字輸入時,目前基礎模型推理力仍很有限。共同資深作者亞當‧羅德曼(Adam Rodman)醫生表示,目前對AI診斷的責任並沒有正式框架,人類仍是評估績效與安全性的終極基準。
(首圖來源:AI)