AI 資料中心網路系統競爭激烈,輝達推 Spectrum-XGS 乙太網路穩住龍頭地位
GPU 大廠輝達 (NVIDIA) 宣布推出 NVIDIA Spectrum-XGS 乙太網路,這是一項可將分散式資料中心整合為一個統一、千兆級規模人工智慧(AI)超級工廠的跨域擴展技術。尤其,隨著 AI 需求大幅提升,個別資料中心在單一設施內的電力與容量已達極限。為了擴展規模,資料中心的規模必須超越單一建築,而現有的乙太網路基礎設施則受限於高延遲、抖動與效能不穩定的瓶頸。
輝達表示,Spectrum-XGS 乙太網路是 NVIDIA Spectrum-X 乙太網路平台的突破性進展,透過導入跨域擴展基礎設施打破既有限制。Spectrum-XGS 乙太網路將作為 AI 運算在垂直擴展(scale-up)及水平擴展(scale-out)之外的第三大支柱,專為擴展 Spectrum-X 乙太網路的極致效能與規模而設計,可連接多個分散式資料中心,形成具備千兆級智慧能力的超大型 AI 超級工廠。
NVIDIA 創辦人暨執行長黃仁勳表示,AI 產業革命已經來臨,而超大規模 AI 工廠是不可或缺的基礎設施。藉由 NVIDIA Spectrum-XGS 乙太網路,我們將跨域擴展技術加入原有的垂直擴展與水平擴展能力,使跨越城市、國家和各大洲的資料中心連結成龐大、千兆級規模的 AI 超級工廠。
Spectrum-XGS 乙太網路已完全整合至 Spectrum-X 平台,其特色在於可視資料中心設施間的距離,動態調整網路的演算法。另外,憑藉先進的自動調整距離壅塞控制、精準的延遲管理及端到端遙測等技術,Spectrum-XGS 乙太網路幾乎可將 NVIDIA Collective Communications Library 的效能提升一倍,加速多 GPU 與多節點間的通訊,為跨區域分布的 AI 叢集提供可預測的效能。因此,多個資料中心可作為單一 AI 超級工廠運作,並且針對長距離連線進行全面最佳化。
資料中心網路基礎架構的部分,使用者為了不希望完全被輝達的架構所歸綁限制,近來陸續有開放性的產品逐漸浮出水面,力搶取代輝達架構的商機。其中,競爭對手博通 (Broadcom) 就是一個強大的競爭對手。其日前推出的Jericho 4 乙太網交換式路由器方面,因為當今的超大型 AI 集群需要約 200 兆瓦的資料中心來容納。然而,許多地區難以提供如此龐大的單一數據中心。這 Jericho 4 應運而生就是透過乙太網交換式路由器,能夠連結多個分散的資料中心,最遠可達 100 公里,使其看起來像一個大型資料中心。
當時博通就表示,網絡是實現分布式計算的關鍵。博通向 GPU 製造商傳達了重要訊息,那就是不應將網路與 GPU 綁定銷售。博通認為,如果 GPU 廠商對其產品有信心,就應該允許市場最好的網路自由競爭,讓最好的網路勝出,同時也讓最好的 GPU 勝出。這種開放競爭的模式,能確保用戶擁有更多選擇,並透過市場力量推動整個行業的技術創新,而非透過封閉生態來限制競爭。
當前,輝達推出的 Spectrum-X 乙太網路平台為多租戶、超大規模的 AI 工廠,包括全球最大的 AI 超級電腦,以提供相較現有乙太網路技術更高的頻寬密度。該平台由 NVIDIA Spectrum-X 交換器及 NVIDIA ConnectX-8 SuperNIC 組成,可為建構未來 AI 的企業提供無縫擴展能力、超低延遲及突破性效能。所以,其瞄準的對象與市場,與博通的 Jericho 4 極為相近。因此,面對競爭對手的來勢洶洶之際,輝達在資料中心基礎網路系統能否穩重王者地位,成為接下來市場關注的焦點之一。
(首圖來源:輝達)