GPT-5 模型發表!編碼更強更快,ChatGPT 功能大躍進
OpenAI 將 o 系列模型的推理能力與 GPT 系列模型的快速回應結合,打造全新 GPT-5 模型,可為用戶執行更多任務,OpenAI 直指 GPT-5 是邁向通用人工智慧(Artificial General Intelligence,AGI)重要的一步。
自 2022 年末 ChatGPT 問世後,GPT-5 可說是 OpenAI 最受市場矚目的產品之一,現在終於正式發表。
當 GPT-5 支援 ChatGPT 時,系統能夠自動切換成推理版本,應對用戶的複雜詢問,不再需要主動選擇模型。
「GPT-3 感覺就像與一名高中生交談。」OpenAI 執行長奧特曼(Sam Altman)形容,「而 GPT-4 就像一名大學生,GPT-5 讓你第一次感覺與博士級專家交談。」
為用戶和開發者帶來升級
隨著 GPT-5 釋出,ChatGPT 升級使用體驗,其中可在設定自選 4 種「性格」,包括憤世嫉俗(批評與諷刺)、機器人(高效與直率)、傾聽者(貼心並給予支援)及極客(有探索精神且熱情洋溢),讓 ChatGPT 無需提示指令也能調整回應風格。
▲ ChatGPT 加入「性格」設定。(Source:科技新報截圖)
GPT-5 將會成為所有 ChatGPT 免費用戶的預設模型,此舉讓免費用戶首次能夠使用 OpenAI 的推理模型。另一方面,付費訂閱的 ChatGPT Plus 用戶比免費用戶享有更高的 GPT-5 用量上限,ChatGPT Pro 用戶不僅無限使用 GPT-5,還能使用性能更強的 GPT-5 Pro。OpenAI 預計 8 月 14 日向 ChatGPT Enterprise 企業版 / Edu 教育版用戶開放 GPT-5。
GPT-5 擅長編寫軟體,發表會展示了包含互動遊戲的學習網站,是透過單一提示就能產生功能齊全的網頁應用程式程式碼。奧特曼預測,GPT-5 的編碼能力將開啟他所說的「software on demand」時代。
串接 API 則有 GPT-5、GPT-5 mini、GPT-5 nano 三種版本,依所需推理深度和速度來選用,GPT -5 Pro 目前無法透過 API 取得,僅支援 ChatGPT。API 還新增「回應長度控制」功能,可自訂模型輸出的長短。
收費方面,GPT-5 每百萬個輸入詞元(token)收費 1.25 美元、每百萬個輸出詞元收費 10 美元,比 GPT-4o、GPT-4.1、o3 還要低,GPT-5 mini 每百萬個輸入 / 輸出詞元為 0.5 / 5 美元,GPT-5 nano 每百萬個輸入 / 輸出詞元為 0.15 / 1.5 美元,使新模型具價格競爭力。
Here's what I mean by "competitively priced" pic.twitter.com/GWEm6vwKpS
— Simon Willison (@simonw) August 7, 2025
▲ GPT-5 系列模型具價格競爭力。
基準測試小幅領先對手
OpenAI 表示,GPT-5 在多個領域達到最先進的水準,在關鍵基準測試略勝 Anthropic、Google、xAI 的模型。但在部分領域,GPT-5 基準測試表現稍稍遜色。
在有關編碼的 SWE-bench Verified,GPT-5 第一次嘗試即獲得 74.9%,略勝 Claude Opus 4.1 的 74.5%,並超越 Gemini 2.5 Pro 的 59.6%。
this screenshot from GPT-5 livestream has to be among the worst chart crimes of the century pic.twitter.com/HXsK2CWCon
— Ege Erdil (@EgeErdil2) August 7, 2025
▲ 發表會上官方公布 SWE-bench Verified 結果,卻因圖表設計錯誤呈現遭詬病。
但在衡量數學、人文及自然科學領域的 Humanity’s Last Exam,具擴展推理功能的 GPT-5 Pro 使用工具時得分 42%,略低於 Grok 4 Heavy 的 44.4%。
在針對博士級科學問題的 GPQA Diamond,GPT-5 Pro 第一次嘗試即獲得 89.4%,勝過 Grok 4 Heavy 的 88.9% 和 Claude Opus 4.1 的 80.9%。
▲ GPQA Diamond 結果。(Source:OpenAI)
OpenAI 表示,GPT-5 在 HealthBench Hard Hallucinations 中,帶思考功能時僅有 1.6% 虛構回應,遠低於自家 o3 的 15.8%、GPT-4o 的 12.9%。雖然 AI 聊天機器人並非醫療專業,實際有數百萬用戶聽取它的健康建議。為此,OpenAI 指出 GPT-5 更積極揭露潛在健康風險,並協助用戶分析醫療結果。
GPT-5 也比過往模型更少出現「幻覺」,OpenAI 在 ChatGPT 提示測試發現,帶思考功能的 GPT-5 只有 4.8% 的回應屬虛構,相較 o3 的 22%、GPT-4o 的 20.6% 大幅下降。
OpenAI 宣稱 GPT-5 較以往模型更安全,雖然推理模型偶有違背人類利益的傾向,OpenAI 發現 GPT-5 的欺瞞率低於其他模型。OpenAI 安全研究團隊負責人貝特爾(Alex Beutel)表示,GPT-5 更能區分企圖濫用 ChatGPT 的惡意分子和提出無害請求的用戶,進而準確拒絕不安全的詢問,並減少對正當詢問請求的回絕次數。
who's making these graphs pic.twitter.com/Zt6yhZuUoo
— Shrey Kothari (@shreyk0) August 7, 2025
▲ 圖表設計再度錯誤,這場發表會的圖表內容應有改善空間。
根據 OpenAI 數據顯示,ChatGPT 成長為全球最受歡迎的產品之一,每週活躍用戶超過 7 億,約占全球人口 10%。GPT-5 可趁這股氣勢,繼續擴大 OpenAI 客戶規模,打造 AGI 造福全人類。
▲ OpenAI 正式發表 GPT-5。
(首圖來源:影片截圖)
留言 0