OpenAI 準備推出 GPT-5　重大突破可能性不高

OpenAI 準備推出 GPT-5，這將是 2023 年 3 月 GPT-4 的後繼模型。然而，根據 The Information 報導，這個新版本預計僅是適度的升級，而非革命性的突破。內部測試顯示，模型在程式設計、數學和遵循複雜指令方面有所進展，例如自動化客戶服務流程。儘管如此，與 GPT-4 相比，其提升幅度明顯小於 GPT-3 (2020) 到 GPT-4 (2023) 的躍進。熟悉評估的人士表示，GPT-5 能產生更易於使用的應用程式，並在運算資源管理上表現更佳，但總體進步據稱相當有限。

進展面臨瓶頸

這種停滯已有多方預測。Bill Gates 早在 2023 年秋季就曾預言此事，而大型語言模型評論家 Gary Marcus、Ilya Sutskever 和 Yann LeCun 也多次指出，基於 Transformer 的大型語言模型架構正接近其極限。一個實例是，OpenAI 最初開發代號為「Orion」的內部模型，旨在直接接替 GPT-4o。然而，Orion 並未達到 OpenAI 期望的效益，因此於 2025 年初以 GPT-4.5 的名義推出，這明確顯示 OpenAI 當時認為它不足以被稱為 GPT-5。GPT-4.5 幾乎沒有引起關注，運行速度較慢且成本高於 GPT-4o，很快便銷聲匿跡。

根據 The Information 報導，主要問題在於預訓練的更改對於較小模型有效，但隨著模型規模擴大，其擴展性不佳。同時，OpenAI 也面臨高品質網路訓練資料的短缺。Orion 在獲得 GPT-5 名稱之前就已停滯。The Information 引述消息來源稱，截至 2025 年 6 月，OpenAI 正在開發中的模型，沒有任何一個被認為足以被稱為 GPT-5。這項挑戰並非 OpenAI 獨有。例如，Anthropic 最近推出的 Claude 4 模型也僅帶來了整體溫和的改進，除了程式設計性能有顯著提升。Anthropic 已採用混合架構，結合了大型語言模型和專業推理組件，OpenAI 也可能為 GPT-5 採納此方法。

推理模型的發展與挑戰

除了主要模型之外，OpenAI 也致力於開發所謂的「推理模型」或「大型推理模型」（LRM），這些模型在獲得更多運算資源時，通常能在複雜任務上表現更佳。它們有望成為數學、網路搜尋和程式設計的有用工具，甚至可能為語言模型指引一個全新的方向。然而，關於它們的泛化能力和能源需求仍存在疑問。OpenAI 在這方面最大的突破發生在 2023 年底，當時 Q* 模型據稱解決了前所未見的數學問題。

在此基礎上，OpenAI 開發了 o1 和 o3 模型，兩者均基於 GPT-4o，並針對專業應用程式設計。o1 和 o3 都採用強化學習 (RL) 進行訓練，其中 o3「教師模型」獲得了更多的運算資源以及直接存取網路和程式碼來源。在強化學習訓練期間，模型會生成專家級問題的答案，並透過將其回應與人類解決方案進行比較來改進自身。然而，當這些模型被調整用於聊天時，o3 的部分能力據報導有所喪失。一位消息人士向 The Information 透露，聊天版本因未受足夠的真實對話訓練而必須「簡化」，這損害了其在聊天和 API 環境中的性能。

今年四月，ARC-AGI 基準突顯了這個問題：公開版本的 o3 在一個艱難的謎題測試中表現不如其內部基礎模型，顯示許多原始推理能力並未在過渡到聊天時保留下來。o3-pro 模型是這種微妙平衡的一個良好範例。專家在科學、程式設計和商業任務中對 o3-pro 的評價高於 o3，但在日常生活中卻難以處理簡單的事情。例如，回應「嗨，我是 Sam Altman」耗費了數分鐘並產生了 80 美元的運算費用，卻只給出一個微不足道的答案，這是過度思考的典型案例。GPT-5 旨在介於專業推理和實用對話之間。

GPT-5 的目標與未來走向

儘管面臨這些技術挑戰，GPT-5 的目標是推動「智能代理」系統的發展，亦即人工智能能夠自主執行多步驟任務的應用程式。這個新模型預計能更有效地遵循複雜指令，並減少人工監督。（GPT-4.1 已朝此方向邁進。）據稱，GPT-5 的能力也將超越 GPT-4o，而無需顯著增加運算資源。內部測試顯示，它能更好地判斷不同任務所需的運算能力，這有望提升效率並避免 o3-pro 等模型出現的過度思考問題。

對於 OpenAI 而言，即使是 GPT-5 的微小改進也可能足以維持客戶和投資者的投入。儘管營運成本高昂，OpenAI 仍持續快速增長。在程式設計相關的 AI 領域，Anthropic 目前以其 Claude 模型領先，而 OpenAI 希望透過 GPT-5 重新奪回優勢。OpenAI 正越來越多地依賴強化學習，特別是採用一種「通用驗證器」，能夠自動評估模型回應的品質，甚至適用於創意寫作等主觀任務。這個通用驗證器也用於最近在國際數學奧林匹亞競賽中獲得金牌的 OpenAI 模型。Jerry Tworek 曾提出，這個強化學習系統可能成為通用人工智能 (AGI) 的基礎。

NewMobileLife 網站：https://www.newmobilelife.com

請更新您的瀏覽器啟用Javascript

OpenAI 準備推出 GPT-5 重大突破可能性不高

流動日報

進展面臨瓶頸

推理模型的發展與挑戰

GPT-5 的目標與未來走向

查看更多

Google Search AI Mode 正式進軍英國 擴大服務範圍

英國瀏覽色情網站需通過年齡驗證 需自拍、信用卡或提供證件

Perplexity Mac 版現已支援 MCP

最新內容

Qualcomm 新款芯片 SM8845 可能命名為 Snapdragon 8 Gen 5

Samsung Galaxy Watch 8 發佈後即享 $50 優惠

Samsung Galaxy Watch 8 最新發佈，現可享 $50 優惠

Tesla 將對陪審團裁決提出上訴，認定其部分負責致命車禍

Galaxy Z Fold 7 買家對 S Pen 的需求不高

Meta砸2.5億美元網羅24歲AI奇才 演算法精英身價直逼體壇巨星

Oukitel WP210 堅固智能手機具備 1,080 萬像素相機及 8,800 mAh 電池

播放量突破四千萬！TFT聯動歌曲《Fighter!!》歌手ASCA專訪！——“為觀衆唱出一起加油的鼓勵”

Samsung Galaxy A17 促銷資料洩露，顯示處理器新動向

SAMSUNG Galaxy Tab S10 Lite快亮相？ 關鍵規格曝光

HUAWEI Pura 70 Pro造工勁？ 網傳跌落黃河一日仲用得

最新《財富》中國500強：賽力斯憑AITO問界品牌強勢增長成躍升幅度最大企業

系列史上最大容量！「桃太郎電鐵２ ～一定也有你的城鎮～」11月13日即將上市！

「BOSS」×「DQ」聯名罐「BOSS QUEST 辿り着いた深煎り」即將上市！還有可以獲得「羅德的BOSS夾克」的活動

iPhone 17 系列即將亮相，細節變化引人注目

iPhone 17 Air 電池漏水問題及其小巧設計分析

Nintendo 在不到一個月內售出近 600 萬部 Switch 2

MacBook Pro 與 Microsoft Office 終身授權套裝特價優惠

iPhone 17 Air 電池容量細節及設計新特點

八月 Apple 的軟件更新及 Apple TV+ 新片單預告

iPad Air M3 現正優惠中，價格下調 $100 供應多種顏色與容量選擇

Apple 第三季度 2025 財報顯示收入增長 10% 及 iPhone 銷售持續強勁

Microsoft 最新報告揭示末來 40 種被 AI 取代的高風險職業

蘋果：預設 Google 搜尋協議帶來風險

Apple Watch 血氧感測功能回歸無望 專利戰持續膠著

日本樂隊 Kroi 運用 40 支 iPhone 16 Pro 拍攝 MV

談 Apple 在 AI 發展的策略 Tim Cook：「我們鮮少搶先」

Google 宣佈仍在活躍的 goo.gl 連結不會失效

Samsung Galaxy S25 FE 完整規格洩露

iPhone 17 Air 新金屬電池曝光 容量 2,900mAh 低 iPhone 16 近二成

Apple iPhone 17 將於今年發佈，但全新 iPhone Fold 或成明年最佳選擇

9to5Mac Daily 節目更新及內容回顧

Apple 自助維修計劃面臨高成本質疑

Apple 超過 30 億部 iPhone 銷售數字達成

Samsung Galaxy A17 4G 和 A17 5G 在歐洲上市，價格詳情披露

iPadOS 26 的「More Space」設定提升多應用程序顯示能力

Apple 產品最新優惠資訊：M4 Mac mini 和 Mac Studio 降價促銷

Google 在緊急申請中承認需於兩週內開始處理 Android 相關事宜

香港最盛大的 My Melody、Kiki & Lala 50週年慶典登陸海港城

請更新您的瀏覽器

Google Search AI Mode 正式進軍英國　擴大服務範圍

英國瀏覽色情網站需通過年齡驗證　需自拍、信用卡或提供證件

Meta砸2.5億美元網羅24歲AI奇才演算法精英身價直逼體壇巨星

SAMSUNG Galaxy Tab S10 Lite快亮相？　關鍵規格曝光

HUAWEI Pura 70 Pro造工勁？　網傳跌落黃河一日仲用得

系列史上最大容量！「桃太郎電鐵２～一定也有你的城鎮～」11月13日即將上市！

Apple Watch 血氧感測功能回歸無望　專利戰持續膠著

談 Apple 在 AI 發展的策略　Tim Cook：「我們鮮少搶先」

iPhone 17 Air 新金屬電池曝光　容量 2,900mAh 低 iPhone 16 近二成