請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

AI 只拿到 D!ChatGPT 分辨科學假設錯誤率仍比想像高

科技新報

更新於 03月18日14:41 • 發布於 03月18日14:50

華盛頓州立大學副教授 Mesut Cicek 領導研究顯示,ChatGPT 判斷科學假設方面錯誤率仍高,儘管模型不斷更新,準確性仍然有限,且重複詢問 AI 同樣問題,答案還是常常不同。

團隊測試719個2021年以來發表的商業期刊科學論文假設。每個假設都可檢驗,團隊要求ChatGPT根據研究分類為真或假,並為了評估可靠性,每個假設以相同提示詢問十次。

2024年團隊已測試過,免費ChatGPT-3.5正確答案比例為76.5%。2025年中的ChatGPT-5 mini,準確率略微上升至80%。考慮到隨機猜測機率,AI模型實際表現僅約60%,研究員認為此表現分數只有D‾。

ChatGPT辨識假陳述的表現最差,正確率僅16.4%。十次相同提示,ChatGPT僅對約73%提示有相同答案,常在真假間反覆跳躍,可靠性令人存疑。

Cicek強調:「我們不只要求準確性,還有不一致性……目前AI工具還不是以人類眼光理解世界,它們還只是提取資料庫數據。」

這項研究的結果突顯科學評估依賴AI的風險,特別是商業等需要假設驅動決策的領域。儘管生成式AI對整理摘要資料或腦力激盪等任務,但仍需要謹慎看待學術誠信和答案不一致。

(首圖來源:shutterstock)

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

鴻海跌破200元 郭台銘身價5天估蒸發339億

NOWNEWS今日新聞
02

川普:美國、伊朗可能在5天內達成協議 甚至更快

anue鉅亨網
03

震撼彈!Grab砸6億美元買下台灣foodpanda,東南亞超級App霸主為何相中台灣?

數位時代
04

手機別充電到100%!她改一設定「保護電池」 蘋果官方證實:延長壽命

CTWANT
05

美伊對話釋善意!川普一句話油價崩了 市場情緒瞬間反轉

anue鉅亨網
06

伊朗否認與美對話 稱川普是受到威脅後「撤退」

anue鉅亨網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...