性能是GB300的7.5倍！輝達Rubin CPX預計明年底上市專家：進一步鞏固在AI基設統治地位

圖：Pixabay/Unsplash/Pexel

美國 AI 晶片巨擘輝達 (NVDA-US) 周二 (9 日) 發表新一代 AI 晶片系統 Rubin CPX，瞄準 AI 視訊生成與軟體開發等大規模情境處理場景，透過技術突破與架構創新，進一步強化自身在 AI 基礎設施領域的領先優勢。

Rubin CPX 預計在 2026 年底正式上市，採用靈活的卡片式設計，既可整合至現有伺服器架構，也能作為獨立運算單元部署於資料中心。

Rubin CPX 的技術規格顯著躍升，GPU 提供 30 千萬億次浮點 (petaflops) 運算能力 (NVFP4 精度)，配備 128GB GDDR7 記憶體，並內建視訊編解碼硬體。相較於輝達目前主流的 GB300 NVL72 系統，新平台的注意力加速效能提升 3 倍。

更值得關注的是，完整版 Vera Rubin NVL144 CPX 平台－單一機架內整合 144 個 Rubin CPX GPU、144 個 Rubin GPU 及 36 個 Vera CPU，可提供 8 exaflops 的 AI 算力，效能達到 GB300 NVL72 系統的 7.5 倍。

輝達執行長黃仁勳在發布會上指出，Rubin CPX 是首款專為百萬級 token 處理設計的 CUDA GPU。「正如 RTX 革新了圖形與物理 AI，Rubin CPX 是專為大規模上下文 AI 打造的 CUDA GPU，能支持模型同時推理數百萬個知識 token。」

在技術創新層面，Rubin CPX 採用分離式推理架構，將 AI 運算拆分為「上下文階段」（處理海量輸入數據，需高吞吐量）與「生成階段」(依賴快速記憶體傳輸與高速互連)，透過獨立優化兩階段資源分配，實現運算與記憶體效率的最大化。

Rubin CPX 配備 100TB 高速記憶體及每秒 1.7 千萬億位元組的記憶體頻寬，憑藉輝達 Quantum-X800 InfiniBand 或 Spectrum-X 乙太網路連接，並由 Dynamo 平台統一調度，較現有基礎設施提供 3 倍注意力加速。

在應用場景涵蓋軟體開發與視訊生成兩大核心領域，新系統在軟體開發中可解析完整程式碼庫，維護跨檔案依賴關係並理解倉庫級結構，推動程式設計助理從「自動完成工具」升級為「智慧協作夥伴」，適配大規模軟體專案需求。

視訊產生方面，單晶片即可完成解碼、編碼與處理，支援處理含 100 萬個記憶體的一小時影片。目前，代碼生成公司 Cursor、視訊創作平台 Runway 及 AI 研究公司 Magic 均已表達合作意向，打算將其應用於程式碼生成、視訊工作流程及 1 億 token 上下文視窗的基礎模型建構。

分析人士指出，Rubin CPX 的推出進一步鞏固輝達在 AI 基礎設施的統治地位。根據預測，輝達的數據中心業務本財年收入有望達到 1840 億美元，超越業內其他公司總和。

透過持續投入軟硬體創新並以特定 AI 工作負載為導向優化硬體，輝達正加速行業對其產品的依賴，推動 AI 基礎設施從通用計算向專用優化轉型，為大規模高價值推理應用開闢新可能。

更多鉅亨報導

理財