阿特曼自誇「口袋博士」 GPT-5上線狂出錯「幻覺超嚴重」
OpenAI於7日發表最新一代人工智慧模型GPT-5,執行長阿特曼(Sam Altman)形容它是「口袋裡的博士級專家」,並將其與歷代版本比較,稱GPT-4相當於大學生,而更早期的版本則像高中生。官方宣稱,這款模型在錯誤率與「AI幻覺」方面都有顯著改善,但一上線便被使用者抓包出現多起基本拼字與地理常識錯誤,引發討論。
根據《衛報》報導,社群平台上已出現多起離譜案例。一名Bluesky使用者多次詢問GPT-5「blueberry」的字母數量,卻反覆得到「含有三個字母B」的錯誤答案,系統甚至幽默補充,稱這讓單詞「更有彈性」。
另一名使用者測試它辨識美國州名時,結果AI將Arizona寫成「Krizona」、Vermont變成「Vermoni」,還重複列出California,並憑空創造出「New Jefst」與「Mitroinia」等不存在的州。
在《衛報》進行的測試中,GPT-5雖能正確列出澳洲各州與領地中包含字母R的名稱,但在計算北領地(Northern Territory)時卻錯將字母R的數量判為3個,而非正確的5個,並在地圖上將其拼為「Northan Territor」。
OpenAI在發表時強調,新系統內建「即時路由器」(real-time router),可根據不同對話需求切換最適合的子模型;當使用者要求「認真思考」時,會導向最新的推理模型,且系統會依真實使用情況持續優化。
不過,媒體與AI新創公司Every執行長希珀(Dan Shipper)指出,即使在理應啟用推理模型的情境下,GPT-5仍可能出現「幻覺」錯誤,例如解讀小說段落時憑空添加情節,必須在被提醒「多想一點」後才會修正答案。
阿特曼坦言,系統在發佈初期確實發生異常,特別是在上線當天,「自動切換器」曾短暫故障,導致GPT-5表現「明顯變笨」。目前該問題已修復並調整模型選擇機制,以提升正確命中率。
阿特曼同時宣布,將把ChatGPT Plus用戶的GPT-5速率限制加倍,並提供保留舊版4o的選項;介面上也會新增更明顯的「深度思考」啟動按鈕,並顯示每次回覆所使用的模型版本。
GPT-5現已向全球每週約7億名使用者開放。阿特曼強調,這款產品尚未達到人工通用智慧(AGI)層級,只是「通往AGI的重要一步」。他也承認,因同時釋出大量新功能,系統穩定性波動超出預期,OpenAI將持續觀察並調整更新節奏,以確保使用者體驗。
留言 0