請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

黃仁勳:運算需求增100萬倍,AI晶片商機「至少1兆美元」!GTC演說重點、輝達新晶片資訊一次掌握

數位時代

更新於 03月18日06:31 • 發布於 03月17日01:52

「這個根本性的轉折終於出現了。」輝達(NVIDIA)執行長黃仁勳在2026年GTC的開幕演講說:「AI現在終於能夠真正做出有生產力的工作,因此推理的轉折點已經到來。」他表示AI現在不只是在訓練模型,而是越來越多時間花在推理(inference),也就是讓AI回答問題、寫程式或完成任務。

為搶攻這波推理需求,輝達推出新的低延遲推理加速器Groq 3 LPU,正式推出Vera CPU,並將其納入新一代AI基礎設施平台「Vera Rubin」,主打支援大規模AI工廠(AI Factory)部署。

黃仁勳指出,過去兩年裡,整體運算需求已經增加了大約100萬倍,再加上推理浪潮的來襲,他預計2027年Blackwell與Vera Rubin架構AI晶片的營收至少會達到一兆美元,並補充:「事實上,供應可能還會不足。我非常確定,運算需求會遠遠高於這個數字。」

延伸閱讀:輝達GTC會前懶人包|搶先看三大「偷跑」消息:新晶片是什麼?輝達也要推AI代理?

什麼是LPU?為什麼要做推論就必須有它?

LPU(Language Processing Unit,語言處理單元)可以理解為一種專門為AI推理設計的處理器,主要目標是讓AI生成文字或回應時速度更快、延遲更低。為了強化推理能力,輝達在2025年底以200億美元(約為新台幣6,289億元)與AI晶片新創Groq達成「非獨家技術授權」,成為輝達有史以來規模最大的交易案。

輝達與Groq攜手推出新一代LPU「Groq 3 LPU」,搶攻AI推理市場。

黃仁勳於開幕演講宣布推出Groq 3 LPU,並表示該晶片由三星量產:「我們已經開始量產Groq晶片了,預計下半年,大概第三季左右開始出貨。」Groq 3 LPU採用高速SRAM記憶體架構,讓晶片在處理AI推理時能更快存取資料,並保持穩定的運算速度。

在新的運算架構中,GPU與LPU會分工合作。GPU負責需要大量計算能力的部分,例如處理長文本和模型中的注意力運算(attention,讓AI理解句子中哪些字詞比較重要的機制);LPU則專門處理需要快速回應的推理步驟,例如生成下一個文字或詞彙。透過這種分工,AI系統可以同時兼顧高運算效率與低延遲回應。

輝達表示,Vera Rubin平台在大型AI模型推理場景中,效能每兆瓦最高可提升約35倍;搭配Groq 3 LPU後,效能還可進一步提升。

再推出Vera CPU,7類晶片組成Vera Rubin平台

除了Groq 3 LPU,輝達也正式推出Vera CPU與Vera Rubin平台。Vera CPU是專門為AI代理(Agentic AI)與強化學習(reinforcement learning)等新型AI工作負載設計的處理器。根據輝達釋出資料,與傳統CPU相比,Vera在效率與速度上都有明顯提升,官方稱其運算效率可提高約2倍,運算速度也快約50%。

Vera CPU採用輝達自研的Olympus核心,共有88個核心,並搭配高頻寬記憶體架構,可提供最高約 1.2TB/s 的記憶體頻寬。

黃仁勳將Vera Rubin平台定義為代理型AI(agentic AI)的轉折點,「隨著Vera Rubin啟動,代理型AI(agentic AI)的轉折點已經到來,也將引發史上最大規模的 AI 基礎設施建設」。該平台由七顆晶片與五種機櫃組成,整合為一台AI超級電腦。

Vera Rubin由七種晶片組成,打造完整的AI工廠。

打開Vera Rubin組成架構:
1. Vera CPU
中央處理器(CPU),負責資料處理、系統控制與AI工作流程管理,例如協調AI代理執行任務或管理資料流。
2. Rubin GPU
圖形處理器(GPU),是整個AI系統的主要運算引擎,負責模型訓練與大規模推理運算。
3. NVLink Switch
高速互連晶片,用來連接大量GPU,讓它們能像一台大型電腦一樣一起運算。
4. ConnectX SuperNIC
高速網路卡(NIC),負責資料中心之間的高速資料傳輸。
5. BlueField DPU
資料處理單元(DPU),專門處理網路、儲存與安全等基礎工作,減少CPU與GPU負擔。
6. Spectrum Ethernet Switch
資料中心網路交換器,用來連接不同機櫃與伺服器。
7. Groq 3 LPU
語言處理單元(LPU),專門負責低延遲AI推理,例如快速生成文字或回應。

這些晶片會被整合進不同類型的機櫃(rack),形成完整AI資料中心。

「輝達的基礎設施是我們持續推進AI前沿的重要基石。」OpenAI執行長奧特曼(Sam Altman)表示。「透過輝達的Vera Rubin,我們將能以超大規模運行更強大的模型與AI代理,並為數億名用戶提供更快速、更可靠的系統。」

輝達表示,基於 Vera Rubin的產品將從今年下半年開始透過合作夥伴提供。

輝達釋出至2028年Feynman為止的產品路線圖。

下一代Feynman呢?

Feynman是Rubin之後的資料中心架構,預計2028年推出。黃仁勳本次首度釋出Feynman架構的CPU名稱,取名為Rosa,透露Feynman也會配有新一代的GPU,並且會與Groq團隊共同打造的新一代LPU LP40,他表示LP40將會是令人難以置信的全新技術。在互連技術方面,Feynman將首次在GPU互連架構中同時支援銅纜與CPO(Co-Packaged Optics,封裝光學)技術。

延伸閱讀:台灣大砸2.89億元!掏錢增持91APP近500萬股:持股比例提升至6.52%,背後有何佈局?

延伸閱讀

Pomelli開放台灣使用了!完整教學:怎麼用它做行銷創意素材?要收費嗎?
GPT-5.4是什麼?哪種方案可用?ChatGPT 6大訂閱方案差異一次看懂
「加入《數位時代》LINE好友,科技新聞不漏接」

查看原始文章

更多理財相關文章

01

鴻海跌破200元 郭台銘身價5天估蒸發339億

NOWNEWS今日新聞
02

川普:美國、伊朗可能在5天內達成協議 甚至更快

anue鉅亨網
03

手機別充電到100%!她改一設定「保護電池」 蘋果官方證實:延長壽命

CTWANT
04

震撼彈!Grab砸6億美元買下台灣foodpanda,東南亞超級App霸主為何相中台灣?

數位時代
05

美伊對話釋善意!川普一句話油價崩了 市場情緒瞬間反轉

anue鉅亨網
06

伊朗否認與美對話 稱川普是受到威脅後「撤退」

anue鉅亨網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...