請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

AI「規模法則」未死!Gemini核心大佬爆:Gemini 3正從「模型」進化為「系統」

anue鉅亨網

更新於 1天前 • 發布於 1天前
圖:Pixabay/Unsplash/Pexel

面對全球人工智慧(AI)賽道的激烈競爭,Google(GOOGL-US) DeepMind 核心團隊近期釋出了震撼業界的訊號:規模法則(Scaling Law)並未終結,而是正迎來一場前所未有的「範式轉移」。

Google 在大型語言模型領域正醞釀一場重磅變革。近日,Google DeepMind 的 Gemini 預訓練負責人 Sebastian Borgeaud 在首度接受採訪時釋出強烈訊號:未來一年,大模型將在「長上下文處理效率」與「長度擴展」兩大核心維度迎來技術重大創新。

Borgeaud 進一步分享,團隊近期在「注意力機制」上有了出乎意料的突破性觀察,這些發現很可能在接下來幾個月,重新定義他們的研究走向。

同時,他拋出一句令人印象深刻的觀點:「規模法則」並沒有走到盡頭,而是正在轉型進化。

Borgeaud 是 Gemini 3 預訓練階段的核心負責人,並在訪談中指出,Gemini 3 的巨大性能飛躍,並非源於單一的「秘密武器」,而是源自無數細微優化的聚合。

他強調,Google 的研究範式已發生根本性轉變:「我們不再僅僅是在構建一個模型,我們正在建構的是一個完整的系統。」

隨著 AI 發展進入「數據有限」的時代,過去那種單純依賴擴大數據集的粗放模式已走入瓶頸。未來的競爭焦點將轉向如何高效利用資源。

Gemini 3 採用的混合專家模型(MoE)架構,正是這一轉變的體現:從追求單純的「大」,轉向追求「大而高效」。

四大技術尖端重塑 AI 核心架構

展望未來幾個月的技術走向,Sebastian 點出了四個關鍵突破方向:

1. 長上下文的「工作台化」: Google 預計在未來一年內大幅提升長上下文的處理效率與長度。這將使模型從單純的「記憶」轉化為「數位工作台」,能同時分析整個代碼庫或海量科研論文,成為強大代理基礎。

2. 注意力機制的底層演進: Sebastian 爆料,研發團隊最近在注意力機制上有了「非常有趣的發現」,這可能在未來幾個月內重塑研究方向,顯著提升模型的推理與計算效率。

3. 檢索機制的原生回歸: 透過可微分的方式讓模型學會「查資料」,而非死記硬背。這能讓模型動態地從外部海量知識源獲取資訊,突破參數規模的限制。

4. 成本革命: 未來的研究將更加關注如何讓強大模型變得「便宜又好用」,以應對用戶激增帶來的部署成本挑戰。

Noam Shazeer 回歸後的冷思考:規模不再是神話

與此同時,Google 的工程師 Jeff Dean、Transformer 開創者 Noam Shazeer 與 Oriol Vinyals 也進行了對談。

其中, Shazeer 的觀點引發業界熱議。回歸 Google 後的他顯得更加冷靜,並為當前的 AI 熱潮潑了一桶冷水。

他幾乎不主動談「顛覆式創新」,也鮮少拋出令人熱血沸騰的宏大敘事;反而多次提到研發節奏的拿捏、系統運作的穩定性,以及如何讓模型能長時間、可靠地運行。

身為 Transformer 架構的關鍵奠基者,他曾親手推動大型模型從零開始的爆發式成長;然而在大型語言模型聲勢正盛之際,他卻選擇踩下煞車,提出警示:模型給出答案的速度越來越快,但自我檢查與反思的次數卻遠遠不夠。

他也曾在公開場合一再強調:「現在的模型並不缺乏『聰明』,真正不足的是持續推理、在複雜任務中反覆修正自身判斷的能力。」

換句話說,模型規模依然關鍵,但它已不再是左右一切的唯一指標。

當 Noam 談到「推理」時,焦點明顯從「能不能變得更強」轉向「能不能長期保持穩定」。

這也是他回到 Google 之後,首次在公開舞台上展現出這樣的判斷與立場。

這番話聽起來並非否定過去的路線,而更像是坦然承認一個現實:那條單靠不斷堆疊參數就能一路向前的成長曲線,正逐漸逼近它的極限。

頂尖科學家的共識:一次高分,無法定義 AI 的未來

Noam 在對談中提出了一個關鍵概念:慢思考(Slow Thinking)。

這並不只是把研發節奏放慢而已,而是要求團隊不斷回頭追問:這樣做值不值得?成本高不高?未來能不能被大規模複製與長期維持?

當討論走到這一步,所謂的「智慧」不再只是抽象的能力指標,而是一項必須長期投入的工程成本,需要像 CPU、儲存空間一樣,被正式納入帳本精算。

一旦跨出這道門檻,許多過去用來評估 AI 的指標,例如 Benchmark,也開始顯得力有未逮。

在整場會議中,三位頂尖科學家並沒有對排行榜表現出特別的興奮,也未曾用「誰贏了誰」來界定技術進展。

排行榜擅長捕捉瞬間的高光時刻,卻難以回答更關鍵的問題:系統能不能長時間穩定運作?

而 Noam 與 Jeff 反覆強調的,正是這些長期維度:模型是否可靠、是否具備遷移能力,以及能否在複雜任務中持續進行自我修正。

這些核心能力,很難被濃縮成一個漂亮、好看的數字,但它們,才是真正決定 AI 未來走向的關鍵。

Gemini 被視為一套系統,而不只是一個模型

在這場對談中,「系統」(System)一詞被反覆提及,顯然不是修辭上的巧合,而是一種刻意為之的定位。

Noam 與 Jeff 在談論 Gemini 時,刻意避開「更強大的模型」這類說法,反而一再強調,它是一個能長期運作、持續演進的完整系統。

乍聽之下,「系統」與「模型」似乎差別不大,但背後的思維邏輯卻截然不同。

所謂的「模型」,更像是一個階段性的成果,重視的是實驗室裡的即時表現;而「系統」則更接近基礎建設,關注的是穩定度、擴展性,以及在出錯時能否快速修復並持續運轉。

對 Noam 這類高度重視架構設計、研發節奏與工程限制的研究者而言,真正重要的從來不是某一次回應有多快,而是一個系統能否穩健地運行十年、甚至二十年。

在他們的視角裡,Gemini 不是用來證明勝負的戰利品,而是一種「可以長期使用」的智慧形態。

也因此,整場對談沒有急著端出產品式的宣傳語言,沒有劍拔弩張的「對標誰、打敗誰」。

它更像是一種對外釋放的訊號:Google 所追求的,並非短暫耀眼的完成品,而是一套能反覆部署、持續升級、不斷自我進化的智慧工業體系。

更多鉅亨報導
Google出手了!不只拚晶片還要拆輝達軟體護城河
AI新創估值過熱成泡沫!Google DeepMind執行長示警:恐難長期維持

點我加鉅亨網LINE好友🔥財經大事不漏接

查看原始文章

更多理財相關文章

01

兩黑馬入列!前11月十家壽險創造15張「百億神單」 挑戰近年新高

工商時報
02

中國傳拼出EUV原型機?荷蘭分析師:很謎

NOWNEWS今日新聞
03

AI泡沫將至?這科技大廠「有業績卻沒股價」 專家曝警訊:投資人開始調節了

風傳媒
04

2026全台地王、地后出爐!1坪698.2萬 「台北101」第13度蟬聯王座

三立新聞網
05

AI股歸隊台積電ADR強彈 無懼外資休假、台指期先返兩萬八大關

太報
06

記憶體戰開打 三星、海力士擴產增速

NOWNEWS今日新聞
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...