請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

科技

OpenAI 準備推出 GPT-5 重大突破可能性不高

流動日報

更新於 6小時前 • 發布於 14小時前 • NewMobileLife

OpenAI 準備推出 GPT-5,這將是 2023 年 3 月 GPT-4 的後繼模型。然而,根據 The Information 報導,這個新版本預計僅是適度的升級,而非革命性的突破。內部測試顯示,模型在程式設計、數學和遵循複雜指令方面有所進展,例如自動化客戶服務流程。儘管如此,與 GPT-4 相比,其提升幅度明顯小於 GPT-3 (2020) 到 GPT-4 (2023) 的躍進。熟悉評估的人士表示,GPT-5 能產生更易於使用的應用程式,並在運算資源管理上表現更佳,但總體進步據稱相當有限。

進展面臨瓶頸

這種停滯已有多方預測。Bill Gates 早在 2023 年秋季就曾預言此事,而大型語言模型評論家 Gary Marcus、Ilya Sutskever 和 Yann LeCun 也多次指出,基於 Transformer 的大型語言模型架構正接近其極限。一個實例是,OpenAI 最初開發代號為「Orion」的內部模型,旨在直接接替 GPT-4o。然而,Orion 並未達到 OpenAI 期望的效益,因此於 2025 年初以 GPT-4.5 的名義推出,這明確顯示 OpenAI 當時認為它不足以被稱為 GPT-5。GPT-4.5 幾乎沒有引起關注,運行速度較慢且成本高於 GPT-4o,很快便銷聲匿跡。

根據 The Information 報導,主要問題在於預訓練的更改對於較小模型有效,但隨著模型規模擴大,其擴展性不佳。同時,OpenAI 也面臨高品質網路訓練資料的短缺。Orion 在獲得 GPT-5 名稱之前就已停滯。The Information 引述消息來源稱,截至 2025 年 6 月,OpenAI 正在開發中的模型,沒有任何一個被認為足以被稱為 GPT-5。這項挑戰並非 OpenAI 獨有。例如,Anthropic 最近推出的 Claude 4 模型也僅帶來了整體溫和的改進,除了程式設計性能有顯著提升。Anthropic 已採用混合架構,結合了大型語言模型和專業推理組件,OpenAI 也可能為 GPT-5 採納此方法。

推理模型的發展與挑戰

除了主要模型之外,OpenAI 也致力於開發所謂的「推理模型」或「大型推理模型」(LRM),這些模型在獲得更多運算資源時,通常能在複雜任務上表現更佳。它們有望成為數學、網路搜尋和程式設計的有用工具,甚至可能為語言模型指引一個全新的方向。然而,關於它們的泛化能力和能源需求仍存在疑問。OpenAI 在這方面最大的突破發生在 2023 年底,當時 Q* 模型據稱解決了前所未見的數學問題。

在此基礎上,OpenAI 開發了 o1 和 o3 模型,兩者均基於 GPT-4o,並針對專業應用程式設計。o1 和 o3 都採用強化學習 (RL) 進行訓練,其中 o3「教師模型」獲得了更多的運算資源以及直接存取網路和程式碼來源。在強化學習訓練期間,模型會生成專家級問題的答案,並透過將其回應與人類解決方案進行比較來改進自身。然而,當這些模型被調整用於聊天時,o3 的部分能力據報導有所喪失。一位消息人士向 The Information 透露,聊天版本因未受足夠的真實對話訓練而必須「簡化」,這損害了其在聊天和 API 環境中的性能。

今年四月,ARC-AGI 基準突顯了這個問題:公開版本的 o3 在一個艱難的謎題測試中表現不如其內部基礎模型,顯示許多原始推理能力並未在過渡到聊天時保留下來。o3-pro 模型是這種微妙平衡的一個良好範例。專家在科學、程式設計和商業任務中對 o3-pro 的評價高於 o3,但在日常生活中卻難以處理簡單的事情。例如,回應「嗨,我是 Sam Altman」耗費了數分鐘並產生了 80 美元的運算費用,卻只給出一個微不足道的答案,這是過度思考的典型案例。GPT-5 旨在介於專業推理和實用對話之間。

GPT-5 的目標與未來走向

儘管面臨這些技術挑戰,GPT-5 的目標是推動「智能代理」系統的發展,亦即人工智能能夠自主執行多步驟任務的應用程式。這個新模型預計能更有效地遵循複雜指令,並減少人工監督。(GPT-4.1 已朝此方向邁進。)據稱,GPT-5 的能力也將超越 GPT-4o,而無需顯著增加運算資源。內部測試顯示,它能更好地判斷不同任務所需的運算能力,這有望提升效率並避免 o3-pro 等模型出現的過度思考問題。

對於 OpenAI 而言,即使是 GPT-5 的微小改進也可能足以維持客戶和投資者的投入。儘管營運成本高昂,OpenAI 仍持續快速增長。在程式設計相關的 AI 領域,Anthropic 目前以其 Claude 模型領先,而 OpenAI 希望透過 GPT-5 重新奪回優勢。OpenAI 正越來越多地依賴強化學習,特別是採用一種「通用驗證器」,能夠自動評估模型回應的品質,甚至適用於創意寫作等主觀任務。這個通用驗證器也用於最近在國際數學奧林匹亞競賽中獲得金牌的 OpenAI 模型。Jerry Tworek 曾提出,這個強化學習系統可能成為通用人工智能 (AGI) 的基礎。

NewMobileLife 網站:https://www.newmobilelife.com

查看原始文章

Google Search AI Mode 正式進軍英國 擴大服務範圍

流動日報

英國瀏覽色情網站需通過年齡驗證 需自拍、信用卡或提供證件

流動日報

Perplexity Mac 版現已支援 MCP

流動日報
查看更多
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

最新內容

Qualcomm 新款芯片 SM8845 可能命名為 Snapdragon 8 Gen 5

TECH RITUAL

Samsung Galaxy Watch 8 發佈後即享 $50 優惠

TECH RITUAL

Samsung Galaxy Watch 8 最新發佈,現可享 $50 優惠

TECH RITUAL

Tesla 將對陪審團裁決提出上訴,認定其部分負責致命車禍

TECH RITUAL

Galaxy Z Fold 7 買家對 S Pen 的需求不高

TECH RITUAL

Meta砸2.5億美元網羅24歲AI奇才 演算法精英身價直逼體壇巨星

VOCO News

Oukitel WP210 堅固智能手機具備 1,080 萬像素相機及 8,800 mAh 電池

TECH RITUAL

播放量突破四千萬!TFT聯動歌曲《Fighter!!》歌手ASCA專訪!——“為觀衆唱出一起加油的鼓勵”

Saiga NAK

Samsung Galaxy A17 促銷資料洩露,顯示處理器新動向

TECH RITUAL

SAMSUNG Galaxy Tab S10 Lite快亮相? 關鍵規格曝光

am730

HUAWEI Pura 70 Pro造工勁? 網傳跌落黃河一日仲用得

am730

最新《財富》中國500強:賽力斯憑AITO問界品牌強勢增長成躍升幅度最大企業

PR Newswire 美通社

系列史上最大容量!「桃太郎電鐵2 ~一定也有你的城鎮~」11月13日即將上市!

Saiga NAK

「BOSS」×「DQ」聯名罐「BOSS QUEST 辿り着いた深煎り」即將上市!還有可以獲得「羅德的BOSS夾克」的活動

Saiga NAK

iPhone 17 系列即將亮相,細節變化引人注目

TECH RITUAL

iPhone 17 Air 電池漏水問題及其小巧設計分析

TECH RITUAL

Nintendo 在不到一個月內售出近 600 萬部 Switch 2

TECH RITUAL

MacBook Pro 與 Microsoft Office 終身授權套裝特價優惠

TECH RITUAL

iPhone 17 Air 電池容量細節及設計新特點

TECH RITUAL

八月 Apple 的軟件更新及 Apple TV+ 新片單預告

TECH RITUAL

iPad Air M3 現正優惠中,價格下調 $100 供應多種顏色與容量選擇

TECH RITUAL

Apple 第三季度 2025 財報顯示收入增長 10% 及 iPhone 銷售持續強勁

TECH RITUAL

Microsoft 最新報告揭示末來 40 種被 AI 取代的高風險職業

流動日報

蘋果:預設 Google 搜尋協議帶來風險

流動日報

Apple Watch 血氧感測功能回歸無望 專利戰持續膠著

流動日報

日本樂隊 Kroi 運用 40 支 iPhone 16 Pro 拍攝 MV

流動日報

談 Apple 在 AI 發展的策略 Tim Cook:「我們鮮少搶先」

流動日報

Google 宣佈仍在活躍的 goo.gl 連結不會失效

流動日報

Samsung Galaxy S25 FE 完整規格洩露

TECH RITUAL

iPhone 17 Air 新金屬電池曝光 容量 2,900mAh 低 iPhone 16 近二成

流動日報

Apple iPhone 17 將於今年發佈,但全新 iPhone Fold 或成明年最佳選擇

TECH RITUAL

9to5Mac Daily 節目更新及內容回顧

TECH RITUAL

Apple 自助維修計劃面臨高成本質疑

TECH RITUAL

Apple 超過 30 億部 iPhone 銷售數字達成

TECH RITUAL

Samsung Galaxy A17 4G 和 A17 5G 在歐洲上市,價格詳情披露

TECH RITUAL

iPadOS 26 的「More Space」設定提升多應用程序顯示能力

TECH RITUAL

Apple 產品最新優惠資訊:M4 Mac mini 和 Mac Studio 降價促銷

TECH RITUAL

Google 在緊急申請中承認需於兩週內開始處理 Android 相關事宜

TECH RITUAL

香港最盛大的 My Melody、Kiki & Lala 50週年慶典登陸海港城

PR Newswire 美通社