阿特曼自誇「口袋博士」　GPT-5上線狂出錯「幻覺超嚴重」

更新於 2小時前 • 發布於 2小時前 • 廖梓翔

（圖／達志／美聯社）

OpenAI於7日發表最新一代人工智慧模型GPT-5，執行長阿特曼（Sam Altman）形容它是「口袋裡的博士級專家」，並將其與歷代版本比較，稱GPT-4相當於大學生，而更早期的版本則像高中生。官方宣稱，這款模型在錯誤率與「AI幻覺」方面都有顯著改善，但一上線便被使用者抓包出現多起基本拼字與地理常識錯誤，引發討論。

根據《衛報》報導，社群平台上已出現多起離譜案例。一名Bluesky使用者多次詢問GPT-5「blueberry」的字母數量，卻反覆得到「含有三個字母B」的錯誤答案，系統甚至幽默補充，稱這讓單詞「更有彈性」。

另一名使用者測試它辨識美國州名時，結果AI將Arizona寫成「Krizona」、Vermont變成「Vermoni」，還重複列出California，並憑空創造出「New Jefst」與「Mitroinia」等不存在的州。

在《衛報》進行的測試中，GPT-5雖能正確列出澳洲各州與領地中包含字母R的名稱，但在計算北領地（Northern Territory）時卻錯將字母R的數量判為3個，而非正確的5個，並在地圖上將其拼為「Northan Territor」。

OpenAI在發表時強調，新系統內建「即時路由器」（real-time router），可根據不同對話需求切換最適合的子模型；當使用者要求「認真思考」時，會導向最新的推理模型，且系統會依真實使用情況持續優化。

不過，媒體與AI新創公司Every執行長希珀（Dan Shipper）指出，即使在理應啟用推理模型的情境下，GPT-5仍可能出現「幻覺」錯誤，例如解讀小說段落時憑空添加情節，必須在被提醒「多想一點」後才會修正答案。

阿特曼坦言，系統在發佈初期確實發生異常，特別是在上線當天，「自動切換器」曾短暫故障，導致GPT-5表現「明顯變笨」。目前該問題已修復並調整模型選擇機制，以提升正確命中率。

阿特曼同時宣布，將把ChatGPT Plus用戶的GPT-5速率限制加倍，並提供保留舊版4o的選項；介面上也會新增更明顯的「深度思考」啟動按鈕，並顯示每次回覆所使用的模型版本。

GPT-5現已向全球每週約7億名使用者開放。阿特曼強調，這款產品尚未達到人工通用智慧（AGI）層級，只是「通往AGI的重要一步」。他也承認，因同時釋出大量新功能，系統穩定性波動超出預期，OpenAI將持續觀察並調整更新節奏，以確保使用者體驗。