亞馬遜 AWS 大搶晶片主導權,自研晶片 Graviton4 升級版將登場
亞馬遜旗下雲端事業 AWS 預告,即將宣布其自研晶片 Graviton4 的更新版本。與此同時,AWS 也正在準備推出另一款自研 AI 訓練晶片 Trainium3。
亞馬遜的晶片策略,不只是強化亞馬遜自身雲端算力供應鏈,也被外界視為直接挑戰 NVIDIA 在 AI 基礎設施市場的主導地位。《CNBC》報導指出,亞馬遜一直試圖降低 AI 訓練成本,並且製造出可以替代 NVIDIA GPU 的產品。
Graviton4 帶來公有雲最快 CPU,與英特爾、AMD 競爭
《CNBC》報導,AWS 將公布的 Graviton4 晶片更新版本,據稱網路頻寬將達到 600 Gbps,是目前所有公有雲 CPU 中速度最快的等級。AWS 工程師 Ali Saidi 形容,這相當於每秒讀取 100 張音樂 CD。
Graviton4 是 Graviton CPU 系列的第四代產品,採用 Arm Neoverse N2 架構,搭載 96 個內核、內建 192MB 快取記憶體,總計 730 億顆電晶體。該處理器同時也納入資安優化功能,像是具備 BTI(分支目標識別,Branch Target Identification)技術,能阻擋試圖利用 Graviton4 分支預測機制發動的網路攻擊。Graviton4 更新的發佈時間表將於 6 月底公佈。
Graviton4 被視為亞馬遜正面迎戰 CPU 市場,與英特爾與 AMD 直接競爭,然而《CNBC》分析,亞馬遜真正的目標,是 NVIDIA 所主導的 AI 基礎設施領域。
Trainium 系列升級,挑戰 NVIDIA GPU 地位
AWS 客戶和產品工程資深總監 Gadi Hutt 向《CNBC》表示,AWS 今年稍晚將推出 Trainium3 晶片,效能預計將是目前 Trainium2 的兩倍,同時提升 50% 的能源效率。
Trainium2 是 AWS 現行的 AI 模型訓練晶片,採用 NeuronCore-V3 架構,單一晶片提供 1.29 petaflops 的 FP8 運算能力,並內建 96 GB 記憶體,允許開發者將多核心的運算和記憶體資源,以光學的方式組合為虛擬核心,以簡化 AI 大規模訓練任務。
Trainium2 已用於 AI 新創 Anthropic 的 Claude Opus 4 模型訓練,並成為 AWS 為該新創打造的 AI 超級電腦「Project Rainier」核心,總部署超過 50 萬顆晶片。AWS 指出,若 Anthropic 沒採用 AWS 晶片,這筆訂單原本可能會落到 NVIDIA 手上。AWS 客戶和產品工程資深總監 Gadi Hutt 更表示,儘管 NVIDIA Blackwell 晶片效能更高,但 Trainium2 的 cp 值(cost performance)更好。
從 CPU 到 GPU,亞馬遜正在展示對於掌控整個 AI 基礎設施堆疊的野心。《CNBC》指出,當越來越多主流的 AI 模型如 Claude 4 證明可以在非 NVIDIA 的硬體上成功訓練,接下來的焦點將不是討論 AWS 「能否」與 NVIDIA 競爭,而是能取得多少市占率。
*本文部分初稿由 AI 生成,經《TechOrange》編撰,資料來源:《CNBC》、《SiliconAngle》,首圖來源:Amazon
留言 0