【你也玩 GPT-5 了嗎】OpenAI 新 AI 模型登場,5 大亮點、企業測試評價一次看
OpenAI 正式發表最新旗艦 AI 模型 GPT-5,並一次推出 GPT-5、GPT-5 Mini、GPT-5 Nano 與 GPT-5 Pro 四種版本,以因應速度、成本與計算深度的不同需求。這也是 OpenAI 首次將推理模型全面開放給所有 ChatGPT 用戶,包括免費方案,讓其近 7 億每週活躍用戶都能直接體驗。
如果使用者打開自己的 ChatGPT 帳戶,可能會發現系統已經預設使用 GPT-5 模型,無法再選擇其他模型如 GPT-4 等。這是因為 GPT-5 將逐步取代現有 ChatGPT 所使用的模型,但 Pro 用戶在 60 天內仍可選用舊模型。
OpenAI 執行長奧特曼將這代模型比喻為「口袋裡的博士級專家」,與先前相比是一大飛躍。他形容,GPT-3 像與高中生對話,GPT-4 像大學生,而 GPT-5 則是第一次有如與博士交流,不僅反應速度快、回應更精確,也能在複雜任務中展現高階推理與多步驟處理能力。
亮點 1:還不是 AGI,但更接近「專家級」
GPT-5 的強大能力傳聞已久,它的能力接近 OpenAI 的終極目標 AGI 嗎?OpenAI 告訴《VentureBeat》,GPT-5 並不是 AGI,但是邁向 AGI 的重要一步,其在推理與泛化能力上顯著提升,接近人類專家水準。對於 OpenAI 來說,GPT-5 距離真正的 AGI 還缺乏持續學習與跨任務自主適應等關鍵能力。
不過,OpenAI 的測試結果顯示,GPT-5 在法律、物流、銷售與工程等多領域表現已能與專家比肩,並超越自家 o3 模型與 ChatGPT Agent。這次 GPT-5 更支援「軟體隨選生成」(software on demand),從單一提示詞就能在數分鐘內寫出可運行的完整應用程式,減少錯誤與來回修正。奧特曼表示,這種軟體隨選的概念,將成為新 GPT-5 時代的決定性要素。
亮點 2:首次向所有 ChatGPT 用戶開放推理模型
這是免費用戶首次能直接使用推理能力的模型。GPT-5 與 GPT-5 Mini 將在 ChatGPT 免費層開放,但有使用次數限制,Plus、Team、Enterprise 用戶則享有更高或無限額度。Pro 訂閱者可獨享 GPT-5 Pro,更適合複雜、多步驟的任務。
新系統 GPT-5 會自動在背後切換不同版本的模型:簡單問題用 Mini 處理,複雜任務則切換到「深度思考」模式,讓 GPT-5 投入更多計算時間與資源。一旦使用者達到 GPT-5 的使用限制,系統也會自動切換到 GPT-5 mini。
亮點 3:全方位性能提升,涵蓋寫作、健康、程式設計
OpenAI 表示, GPT-5 是該公司目前發布的最準確、反應最迅速、情境感知能力最強的 AI 系統,在寫作、程式開發與健康領域,GPT-5 表現明顯提升,幻覺率也較低。官方測試顯示,其在 GPQA 基準測試中達 88.4%,AIME 2025 數學測驗更以 Python 作答拿下滿分,SWE-Bench Verified 則達到 74.9%,多語程式測試 Aider Polyglot 也達到 88%。
此外,GPT-5 在回應中能更主動提出問題、協助解讀醫療檢測結果,指導用戶準備就診或比較不同方案,同時根據地區與背景資訊提供更安全、個人化的建議。
亮點 4:「安全完成」系統,降低拒答與不安全輸出
過去 ChatGPT 有時會因安全疑慮直接拒答,GPT-5 則改採「安全完成」(safe completions)機制,在不越界的情況下盡可能提供有用回覆,並清楚解釋何時無法提供協助。同時,它在事實錯誤率上比 GPT-4o 減少約 45%,在「深度思考」模式下錯誤率可降至 20% 以下。
亮點 5:開發者 API 工具更彈性、更具成本競爭力
GPT-5 對於開發人員來說也是重大升級,新增多項控制選項,包括自由格式函數呼叫、推理深度控制(分為低、中、高、minimal 模式)、回應冗長度調整、輸出約束等功能。OpenAI 表示,開發者可在「minimal」推理模式下兼顧速度與準確度,適用於即時客服、快速儀表板等對延遲性極為敏感的場景。
此外,《VentureBeat》分析,與主要競爭對手 Anthropic 和 Google 相比,OpenAI 的 GPT-5 模型在透過 API 供開發者使用時,價格相當或更便宜,進一步對「智慧成本」施加下行壓力。
瞄準整合策略,企業測試回饋正面
為了測試 GPT-5 的功能,OpenAI 聘請多家公司進行早期測試,包括熱門 AI 程式輔助工具 Cursor 的開發商 Anysphere,以及瑞典氛圍式程式開發新創公司 Lovable。JetBrains 也用 GPT-5 強化開發工具,Notion 則提升文件生成與工作流程效率,而這些企業給予了高度評價。
AI 開發平台 Cursor 執行長 Michael Truell 表示,GPT-5 能偵測深藏的程式漏洞、長時間運行、多回合代理任務。Lovable 共同創辦人兼執行長 Anton Osika 則表示,他的公司發現 GPT-5 在快速構建複雜應用程式方面優於其他 AI 模型,能生成更容易維護的程式碼,在修復軟體錯誤方面也表現良好。
《VentureBeat》認為,這次 OpenAI 重點不在推出獨立產品,而是將 GPT-5 深度嵌入 ChatGPT 與 API,成為用戶與開發者現有工具的核心引擎。《Bloomberg》則指出,儘管 OpenAI 面臨來自前員工與盟友的新競爭,其最大武器依然是 ChatGPT。
- 立即報名 8/13【製造業資安論壇】,鴻海科技集團、台達電子、SEMI、資策會、Google Cloud 等重磅講者解密供應鏈必備的資安原生思維
*本文開放合作夥伴轉載,資料來源:《VentureBeat》、《The Verge》、《Reuters》、《Bloomberg》,首圖來源:OpenAI
留言 0