GPT-5 達極限?當資料耗盡、晶片受限「AI 競賽的性質已改變」
OpenAI 上週推出備受期待的新人工智慧模型 GPT-5 ,執行長 Sam Altman 將 GPT-5 形容為「朝向 AGI 道路上的重要一步」,意指這類 AI 系統能超越人類智慧水平。OpenAI 高層同時認為,這個新模型也能修補 ChatGPT 的瑕疵,OpenAI ChatGPT 負責人 Nick Turley 表示,「這個模型給人的感覺很好,我想大家會感受到。」
學界與投資人質疑 GPT-5,矽谷泡沫隱憂浮出
然而,實際情況並非如此。《Financial Times》提及,發佈後不久,用戶在社群媒體上分享新模型犯下基本錯誤的圖片,例如錯誤標註美國地圖,且熟悉 OpenAI 先前模型的高階使用者對模型「人格」的改變感到失望,其在基準測試中的表現不及競爭對手。
《Financial Times》指出,在所有的炒作之後,這個大型語言模型被廣泛視為對前代產品的漸進式改進,而非先前 GPT 版本所承諾的能力大躍進。開源 AI 新創公司 Hugging Face 的共同創辦人暨首席科學家 Thomas Wolf 表示,「人們期待 GPT-5 能發現全新的東西,但實際上並沒有。」經過數千億美元對生成式 AI 及其運算基礎建設的投資後,矽谷突然出現一個問題:「如果這已經是最好的表現了呢?」
過去三年,AI 研究人員、使用者與投資人已習慣於高速的改進節奏。《Financial Times》提及,曾經 OpenAI 看似無可匹敵,但競爭對手如 Google、Anthropic、DeepSeek 以及馬斯克的 xAI,縮小了技術的差距。這場激烈競賽助長了 AGI 即將來臨的承諾,紐約大學心理學與神經科學教授、知名 AI 評論者 Gary Marcus 表示:「GPT-5 是整個規模化邁向 AGI 方法的核心象徵,但它沒有成功。」
加州大學柏克萊分校電腦科學教授 Stuart Russell,是最早警告 AI 能力可能超越人類控制能力的研究者之一,他現在將現況比作 1980 年代的 AI 冬天,當時的創新未能達到預期,也未帶來投資回報。Stuart Russell 指出,「那時泡沫破裂了,系統賺不到錢、找不到足夠高價值的應用,就像音樂椅遊戲,每個人都在跑,誰也不想成為最後抱著 AI 的人。」Stuart Russell 認為如果期望被抬得過高,一旦投資者認為泡沫過度膨脹,AI 的炒作就可能遭到重創。
如果 AI 已接近極限,下一步該怎麼走?
《Financial Times》指出,問題的一部分在於公司建構大型語言模型的方式。
過去五年,OpenAI、Anthropic 等公司藉由簡單公式展示系統性能持續提升,更多資料加更強運算力等於更大、更好的模型,許多 AI 領袖仍相信這個「規模法則」可持續數年,但其實已開始觸及可用資源的極限。
舉例來說,AI 公司已吸取網路上所有可用的免費訓練資料,透過與出版商和版權持有者達成資料共享協議尋找更多模型燃料,但是否足以推動技術仍不明確。
AI 實驗室也受限於運算能力,訓練與運行大型 AI 模型非常耗能,《Financial Times》補充,早在 2022 年,GPT-4 就使用數千顆 NVIDIA 晶片進行訓練,估計 GPT-5 使用了數十萬顆 NVIDIA 下一代處理器,而更強大的晶片仍在研發中。
《Business Insider》提及,Google 執行長 Sundar Pichai 在知名 Podcast 節目《Lex Fridman Podcast》,用 AJI 人工鋸齒智慧(Artificial Jagged Intelligence)描述在某些領域表現優秀、卻在其他領域頻頻失誤的系統。英國 AI 公司 DeepMind 創始人 Demis Hassabis 也認為,解決 AI 一致性問題需要的不僅是擴大數據和運算能力。他補充,「在推理、規劃與記憶方面的缺失仍需要突破。」
OpenAI 執行長 Sam Altman 承認,公司已碰到某些極限,他在舊金山晚宴對記者說,雖然基礎 AI 模型仍在快速進步,但像 ChatGPT 這樣的聊天機器人「不會進步太多」。Meta 科學家 Yann LeCun 則表示:「我們正在進入純文字訓練的 LLM(大型語言模型)收益遞減階段,但透過影片或其他模式理解現實世界的深度學習 AI 系統,絕對沒有碰到天花板。」
你以為 GPT-5 失敗,其實遊戲規則正在改變
《Financial Times》說明,GPT-5 的發佈清楚顯示,AI 競賽的性質已改變。
普林斯頓大學研究員 Sayash Kapoor 說,AI 公司不再只是建造炫目的大型模型,而是「慢慢接受自己是在為產品建構基礎設施」。
Kapoor 與團隊評估了領先 AI 模型在科學研究、網路任務、程式設計與客戶服務等任務中的表現。結果顯示 GPT-5 並非明顯劣勢,而是在各種任務中均為中上水平,Sayash Kapoor 表示「它真正的優勢在於成本效益高,而且比其他模型快得多。」能推動更多創新型產品與服務的應用,即便沒對 AGI 或所謂超智慧帶來突破性進展。
AI 政策研究員、前 OpenAI 員工 Miles Brundage 說:「AI 在許多實用場景被應用,自然會讓人更多關注產品應用,而非抽象的 AGI。」OpenAI 及 Cohere、Mistral、xAI 等 AI 領先公司已開始聘用所謂的「前線部署工程師」,將模型整合至系統嵌入客戶公司。
《Financial Times》指出,雖然 GPT-5 令人失望,但在矽谷更看重「感覺」而非科學基準下,AI 的熱潮短期內不太可能停歇。開源社群平台 Hugging Face 的聯合創始人 Thomas Wolf 也表示「仍有很多酷炫的東西可以打造,即便不是 AGI 或超級智慧(superintelligence)。」
*本文開放合作夥伴轉載,資料來源:《Financial Times》、《Business Insider》,圖片來源:Unsplash。
留言 0