性能是GB300的7.5倍!輝達Rubin CPX預計明年底上市 專家:進一步鞏固在AI基設統治地位
美國 AI 晶片巨擘輝達 (NVDA-US) 周二 (9 日) 發表新一代 AI 晶片系統 Rubin CPX,瞄準 AI 視訊生成與軟體開發等大規模情境處理場景,透過技術突破與架構創新,進一步強化自身在 AI 基礎設施領域的領先優勢。
Rubin CPX 預計在 2026 年底正式上市,採用靈活的卡片式設計,既可整合至現有伺服器架構,也能作為獨立運算單元部署於資料中心。
Rubin CPX 的技術規格顯著躍升,GPU 提供 30 千萬億次浮點 (petaflops) 運算能力 (NVFP4 精度),配備 128GB GDDR7 記憶體,並內建視訊編解碼硬體。相較於輝達目前主流的 GB300 NVL72 系統,新平台的注意力加速效能提升 3 倍。
更值得關注的是,完整版 Vera Rubin NVL144 CPX 平台-單一機架內整合 144 個 Rubin CPX GPU、144 個 Rubin GPU 及 36 個 Vera CPU,可提供 8 exaflops 的 AI 算力,效能達到 GB300 NVL72 系統的 7.5 倍。
輝達執行長黃仁勳在發布會上指出,Rubin CPX 是首款專為百萬級 token 處理設計的 CUDA GPU。「正如 RTX 革新了圖形與物理 AI,Rubin CPX 是專為大規模上下文 AI 打造的 CUDA GPU,能支持模型同時推理數百萬個知識 token。」
在技術創新層面,Rubin CPX 採用分離式推理架構,將 AI 運算拆分為「上下文階段」(處理海量輸入數據,需高吞吐量)與「生成階段」(依賴快速記憶體傳輸與高速互連),透過獨立優化兩階段資源分配,實現運算與記憶體效率的最大化。
Rubin CPX 配備 100TB 高速記憶體及每秒 1.7 千萬億位元組的記憶體頻寬,憑藉輝達 Quantum-X800 InfiniBand 或 Spectrum-X 乙太網路連接,並由 Dynamo 平台統一調度,較現有基礎設施提供 3 倍注意力加速。
在應用場景涵蓋軟體開發與視訊生成兩大核心領域,新系統在軟體開發中可解析完整程式碼庫,維護跨檔案依賴關係並理解倉庫級結構,推動程式設計助理從「自動完成工具」升級為「智慧協作夥伴」,適配大規模軟體專案需求。
視訊產生方面,單晶片即可完成解碼、編碼與處理,支援處理含 100 萬個記憶體的一小時影片。目前,代碼生成公司 Cursor、視訊創作平台 Runway 及 AI 研究公司 Magic 均已表達合作意向,打算將其應用於程式碼生成、視訊工作流程及 1 億 token 上下文視窗的基礎模型建構。
分析人士指出,Rubin CPX 的推出進一步鞏固輝達在 AI 基礎設施的統治地位。根據預測,輝達的數據中心業務本財年收入有望達到 1840 億美元,超越業內其他公司總和。
透過持續投入軟硬體創新並以特定 AI 工作負載為導向優化硬體,輝達正加速行業對其產品的依賴,推動 AI 基礎設施從通用計算向專用優化轉型,為大規模高價值推理應用開闢新可能。
更多鉅亨報導