請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

【半導體】黃仁勳 GTC 主題演講 9 大重點一次看

財經M平方短評

更新於 03月19日13:33 • 發布於 03月19日13:33

重點整理

黃仁勳於 3/19 GTC 大會上發表主題演講,以下為 M平方整理的 9 大重點:

  • Scaling Law 未死,算力需求將超越預期。
  • 全球對數據中心的資本支出仍將繼續成長,規模達 1 兆美元。
  • 合成數據的重要性。
  • Nvidia 的生態系優勢。
  • 推理模型算力需求,將帶動矽光子技術需求。
  • 矽光子交換器 Quantum-X InfiniBand 和 Spectrum-X Photonics 即將出貨。
  • 開源推理模型架構 NVIDIA Dynamo,加速推理效率。
  • GPU 路線圖:Blackwell Ultra -> Rubin + Vera -> Feynman。
  • 下一個數兆(Multi-Trillion)產業 - 機器人。

MM 研究員

Scaling Law 未死,算力需求超越預期。

幾乎整個世界都低估了 AI 算力需求,AI 的 Scaling Law 比預期的更具韌性,甚至進入超加速(Hyper-accelerated)階段, 隨著 Agentic AI 和 推理能力的發展,我們所需的計算量遠超過去年同期的預測——至少是當初估計的 100 倍。 推理 AI 的本質是「將問題逐步拆解」,這種變化導致生成的 Token 數量會大幅增加,因為目前 AI 的基礎技術仍然相同,仍是「生成或預測下一個 Token 」,因此推理模型可能是:1) AI 直接生成比傳統 LLM 多 100 倍的 Token 量;2) AI 模型變得更複雜,生成的 Token 變成 10 倍,但計算量仍然大幅上升。

因此為了保持 AI 反應迅速、即時互動(否則使用者等待過久會失去耐心),必須加速 AI 的計算效率,以適應劇增的推理需求。

全球對數據中心的資本支出仍將繼續成長,規模達 1 兆美元

在 Scaling Law 未死,算力需求大增下,全球數據中心(包括 CSP 、企業等)的資本支出預估,可在 2028 年左右將會超過 1 兆美元,且業界在各方面都正在轉移至 AI 加速運算,包括:

  • 過去使用檔案檢索式計算(Retrieval-Based Computing),軟體是人類手動編寫的,然後在電腦上執行。而現在及未來的軟體將由 AI 自動生成,計算機的作用從檢索(Retrieval)變成生成(Generative)
  • 儲存系統也必須徹底改造,從「基於檢索(retrieval)的儲存系統」轉變為「基於語義(semantics)的儲存系統」,將原始數據轉化為知識,然後在你需要訪問時,不再是檢索它,而是直接與它對話,因此整個儲存產業都會被 GPU 加速。
  • 未來軟體的開發也將需要大量資本投入:過去我們只需要手動寫好軟體並執行它,但現在電腦本身將成為「軟體生產者」,負責生成軟體所需的 Token。這意味著企業、雲端服務供應商或甚至個人開發者都需要重新規劃基礎設施,以適應 AI 時代的計算需求。

合成數據的重要性

我們可以生成數百萬個不同的範例,並讓 AI 進行數百次、數千次的嘗試,逐步解決問題。在這個過程中,我們使用強化學習來獎勵 AI,使其表現越來越好。因此,當我們涵蓋數百個不同的主題,每個主題又包含數百萬個範例,每個範例 AI 可能嘗試數百次,而每次嘗試都會生成數以萬計的 token(作為訓練數據),這一切加總起來,就意味著我們需要處理數兆級別的 token 來訓練 AI 模型。而機器人所需要的「行動」和「控制」數據也會帶動合成數據生成(Synthetic Data Generation)的興起 。

Nvidia 的生態系優勢

AI 的發展過程中你不能只是加速軟體。就像我們需要一個 AI 框架來創建 AI,你也需要為物理學、生物學、多物理場以及量子物理等領域創建相應的框架,而 Nvidia CUDA-X Libraries 涵蓋各種框架,包括 cuLITHO 、 AERIAL SIONNA 、 cuOPT 、 MONAI 、 EARTH-2 、 cuQUANTUM 、 cuDSS 、 WARP 等,以及機器人和自駕平台 Cosmos 、推理模型架構 NVIDIA Dynamo 和人形機器人基礎模型 GROOT N1,這些軟體護城河都將會讓各產業未來在應用 AI 上更加依賴 Nvidia 的生態系。

推理模型算力需求,將帶動矽光子技術需求

推理模型(DeepSeek R1 為例)會比傳統的 LLM 模型(Llama 3.3 70B 為例)花上 20 倍以上的 Token 數量以及 150 倍以上的算力,且未來模型會愈來愈複雜,推理模型的參數也將會愈來愈多,為了符合 AI 模型追求更快更好的推理性能的趨勢,有兩種策略提升系統性能「 Scale up 」和「 Scale out 」:

  • 因為要 Scale up(單一 rack 的性能提升),所以冷卻系統必須從氣冷(air-cooled)走到水冷(liquid-cooled),而線材繼續使用銅線因為短距離可以提供極高的可靠性且成本低。
  • 因為要 Scale out(rack to rack 的性能提升),NVlink 也開始從集成(integrated)到分離(disaggregated),線材部分因為數據中心的規模愈來愈大,因此需要更適合長距離傳輸的技術,將是矽光子(silicon photonics)發揮作用的地方。

矽光子交換器 Quantum-X InfiniBand 和 Spectrum-X Photonics 即將出貨

NVIDIA 宣布推出全球首款 1.6 Tbps 共同封裝光學(CPO)矽光子系統。這項技術基於微環諧振調製器(micro ring resonator modulator,MRMs),是一種突破性的光通訊技術,並採用台積電 COUPE 矽光子平台和 SoIC-X 封裝技術,將 65 奈米電子積體電路(EIC)與光子積體電路(PIC)整合。 2025 下半年 Nvidia 將開始出貨 Quantum-X InfiniBand,2026H2 將會出貨 Spectrum-X Photonics。

開源推理模型架構 NVIDIA Dynamo,加速推理效率

未來模型在推理時,會根據工作負載決定將更多的 GPU 用於解碼(Decode)或用於預處理(Prefill),而這種動態調整非常複雜,包括流水線並行(pipeline parallel)、張量並行(tensor parallel)、專家並行(expert parallel)、預處理前批處理(prefill batching)、分離推理(disaggregated inferencing)和工作負載管理(workload management),以及將 KV cache 導向正確的 GPU 以及在所有記憶體中的傳遞,這些管理極其複雜,因此 Nvidia 公佈了 NVIDIA Dynamo 的開源推理模型架構:透過分散式運算可協調並加速數千個 GPU 的推理傳輸,且支援包括 PyTorch 、 SGLang 、 NVIDIA TensorRT-LLM 和 vLLM,企業、新創與研究人員可使用熱門的 AI 框架進行部署,同時實現分散式推理,可提升 AI Factory 的性能、縮減回應時間與降低模型成本。

GPU 路線圖:Blackwell Ultra -> Rubin + Vera -> Feynman

  • 下一代 AI 晶片 Blackwell Ultra(GB300 系列)將於 2025 年下半年推出,記憶體容量提升 50% 以上,性能顯著優於現在地 Blackwell。

  • Rubin Ultra 大約 2027H2 推出,會擁有 576 個 GPU,每個機櫃 600 KW(GB200 是 144 個 GPU,每個機櫃耗電 120 KW)。

  • Vera CPU 將會用來取代目前的 Grace CPU。

  • Rubin 產品線將從 HBM3/HBM3e 轉向 HBM4,並在 Rubin Ultra 上採用 HBM4e。

  • 性能及成本:

  • 性能(Performance):Vera Rubin = 900x Hopper;Blackwell(GB200)= 68x Hopper

    • 成本(TCO/Perf):Vera Rubin = 0.03 Hopper:Blackwell(GB200)= 0.13 Hopper
  • 繼 Rubin 之後,2028 年將推出 Feynman 架構。

下一個數兆(Multi-Trillion)產業 - 機器人

  • Physical AI 將會以機器人的形式出現在各行各業,包括工廠、醫療和街道各種不同應用,而訓練機器人需要大量數據,除了網路上提供了「常識」跟「推理」的數據,但機器人更需要「行動」和「控制」的數據,且這些數據的獲取成本非常高,而基於 Nvidia 的 Omniverse 和 Cosmos 架構,開發者可以生成大量多樣化的合成數據來訓練機器人策略。例如 Omniverse 中使用了糖果色來展示如何在各情境中控制機器人,而 Cosmos 可進一步創造這個虛擬環境。
  • 將 GROOT N1 開源:全球首個開源人形機器人基礎模型 Isaac GROOT N1,配備新物理引擎訓練觸覺和靈活性,具有「慢思考」和「快思考」系統的雙架構,靈感來自人類認知處理,能夠輕鬆操控物體並協作完成多步驟任務 。

推薦閱讀

加入〈財經M平方〉官方Line,掌握最新行情!

更多理財相關文章

01

Google地圖「這功能」9月將刪除 提醒用戶:相關資料「徹底清除」

太報
02

川普「投資換關稅」成形 法人:台灣挾台積電三大條件、稅率望轉佳

太報
03

付錢進辦公室、加購請主管罵人?中國青年失業潮下的荒誕:「假裝上班公司」如何因應社會焦慮而生?

Cheers 快樂工作人
04

台積電要小心?Intel 14A製程吸引蘋果、輝達關注 明年恐正面交鋒

CTWANT
05

左手賣右手!爛尾樓詐貸35億 專家花20元調「這張紙」趨吉避凶

好房網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
查看更多

留言 0

沒有留言。

最新消息

中美第三輪談判前夕 傳關稅休戰將延長3個月

anue鉅亨網

台股週報》台美關稅開牌 多空表態震盪大

卡優新聞網

盤中速報 - 比特幣現金大漲8.36%,報600.4美元

anue鉅亨網

盤中速報 - Golem大漲17.4%,報0.32美元

anue鉅亨網

盤中速報 - FIS大漲10.48%,報0.1339美元

anue鉅亨網

盤中速報 - Omni Network大漲19.42%,報2.89美元

anue鉅亨網

盤中速報 - Ethena大漲14.07%,報0.64美元

anue鉅亨網

MM行事曆

財經M平方行事曆

日揚 公告本公司114年第2季財務報告董事會召開日期

MoneyDJ理財網

盤中速報 - Golem大漲16.32%,報0.32美元

anue鉅亨網

本週操盤筆記:美日加央行利率決策、美歐GDP及通膨數據、科技巨頭財報

anue鉅亨網

國銀搶億級富豪商機 6月底管理資產衝1.6兆

中央通訊社

「又對英特爾燃起希望」 陸行之解析陳立武大刀改革:難道他就是救世主

風傳媒

【焦點時事】台北電玩展倒數1天!10檔概念股再迎行情?

CMoney

盤中速報 - IDEX大跌12.08%,報0.0316美元

anue鉅亨網

盤中速報 - 比特幣現金大漲8.21%,報601.1美元

anue鉅亨網

印度IT服務巨擘TCS將裁員2% 逾1.2萬職位受影響

中央通訊社

Google地圖「這功能」9月將刪除 提醒用戶:相關資料「徹底清除」

太報

良得電Q3可望略優預期 奪美系客戶新標案量增2-3成

anue鉅亨網

川普撤換鮑爾恐釀世界級災難?施俊吉曝降息2危機:對美國經濟是提油救火

風傳媒

【全球】行情回顧與本週重點

財經M平方短評

輝達解禁、對台關稅藏玄機?送錢行情別錯過!總經大師吳嘉隆喊:台股「這價位」遲早會過!點名AI、機器人只看這幾檔!

優分析

美債將崩盤?想太多!總經大師吳嘉隆揭川普4大「印鈔級」絕招,債務危機攏是假!

優分析

Google地圖「顯示媒體播放控制項」莫名消失?官方給出這回應!

手機王

盤中速報 - Ethena大漲8.7%,報0.62美元

anue鉅亨網

跨海法槌遭遇紅色壁壘:任天堂最強法務也難撼動的中國市場

科技新報

泰國與柬埔寨同意由馬來西亞調解!力求終止邊境衝突

anue鉅亨網

改變矽谷規則的週末:Windsurf 戲劇性收購案,讓員工和創辦人一分為二

科技新報

小米第六代平板現在買超便宜!Xiaomi Pad 6通路最低價格一次看(2025.7)

手機王

獨家/連鎖咖啡進軍百貨身價翻倍? 蛋糕升級價差破百元

鏡新聞

一年一度亞洲生技大會落幕(圖)

中央通訊社

巴隆:美中瑞典貿易會談有望達成關稅協議、領導人會晤成焦點

anue鉅亨網

亞洲生技大會落幕創14萬人潮 有望帶動千億合作商機

中央通訊社

盤中速報 - Omni Network大漲40.33%,報3.41美元

anue鉅亨網

美國財政部允許民眾透過PayPal自願捐贈 幫助償還國債

anue鉅亨網

英特爾將退出晶圓代工?陳立武示警缺大客戶恐轉向、台積電或受益

anue鉅亨網

買5000萬房送子竟挨罰!國稅局:這「關鍵動作」沒做 他吞百萬罰單

三立新聞網

鉅亨買幣速報 - 以太幣(ETH)24小時成交量超過13.73億美元,Measurable Data Token(MDT)24小時漲幅達20.4%

anue鉅亨網

WAIC兩岸論壇 台灣業者:期待辦得「更自由一點」

中央通訊社

2025年WAIC兩岸論壇 英業達(北京)總經理邱全成(2)(圖)

中央通訊社