AMD MI350 系列細節公開,效能比前代提升 35 倍
AMD 在 Hot Chips 2025 揭露最新 Instinct MI350 GPU 系列,搭載全新 CDNA 4 架構,針對生成式 AI 與 HPC。
隨著大型語言模型(LLM)規模急速膨脹,GPU 需要更大的記憶體與更快頻寬,而 MI350 正是為了解決這個問題而誕生。MI350 採用台積電 3nm(N3P)與 6nm(N6)FinFET 製程,並運用 COWOS-S 先進封裝技術,搭配 3D 多晶粒封裝,將高效能核心與成本效益良好的 I/O 晶粒結合。
(Source:AMD)
HBM 容量衝上 288GB,推理與訓練效能全面提升
記憶體部分則是最大亮點,搭載 8 顆 HBM3E 堆疊,每顆高達 12 層(12-Hi),單顆 36GB,總容量 288GB,比 NVIDIA B200多出約 1.5 倍,而頻寬高達 8TB/s,不論是推理或訓練,都能提供卓越的資料處理效能。
FP8 算力飆破 80 PFLOPs,推理效能躍升 35 倍
在運算表現上,AMD指出,MI350系列下的 MI355X 支援 FP8 運算約 80 PFLOPs,FP16/BF16 亦可達 40PFLOPs,並新增 MXFP6、MXFP4低精度格式,特別針對 LLM 推理優化。晶片整合 256 MB Infinity Cache,再加上 5.5TB/s Infinity Fabric 雙向頻寬,實現高速互連。整體效能相較前代 MI300,推理能力最高躍升 35 倍。
氣冷 vs 液冷
至於散熱部分,MI350 系列提供兩種配置版本,其中 MI350X 採用氣冷設計,功耗為 1000W,最高時脈可達 2.2GHz;而 MI355X 則採用液冷方案,功耗提高至 1400W,時脈上看 2.4GHz,主要大入資料中心市場。
(Source:同上)
AMD 預計 MI350 系列將於 2025 年第三季透過合作夥伴進入市場,下一代 MI400 系列則已在研發,計畫於 2026 年推出。
(首圖來源:AMD)