請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

合作夥伴齊聲背書 NVIDIA AI 推論效能領跑全球

新頭殼

更新於 12小時前 • 發布於 12小時前 • Newtalk新聞 |蘇元和 綜合報導
Blackwell Ultra 架構提供與 Blackwell 相比1.5 倍的 NVFP4 AI 運算與 2 倍的 attention-layer 加速,且每顆 GPU 可配備最高 288GB 的 HBM3e 記憶體。 圖: 輝達/提供

Newtalk新聞

推論效能至關重要,因為它會直接影響人工智慧(AI)工廠的經濟效益。AI 工廠基礎設施的輸送量越高,就能以高速產生更多詞元(token),進而提高營收、降低總擁有成本(TCO),並提升整體系統的生產力。

NVIDIA表示,採用 NVIDIA Blackwell Ultra 架構的 NVIDIA GB300 NVL72 機架規模系統,在 NVIDIA GTC 大會首度亮相至今不到半年後,已在 MLPerf Inference v5.1 的全新推理(reasoning)推論基準上創下紀錄,與採用 NVIDIA Blackwell 架構的 GB200 NVL72 系統相比,DeepSeek-R1 推論的輸送量最高可達 1.4 倍。

Blackwell Ultra 建立在 Blackwell 架構的成功之上。Blackwell Ultra 架構提供與 Blackwell 相比1.5 倍的 NVFP4 AI 運算與 2 倍的 attention-layer 加速,且每顆 GPU 可配備最高 288GB 的 HBM3e 記憶體。

NVIDIA 平台也在 MLPerf Inference v5.1 套件新增的所有資料中心基準上創下效能紀錄,包含 DeepSeek-R1、Llama 3.1 405B Interactive、Llama 3.1 8B 與 Whisper,同時持續維持每顆 GPU 在每項 MLPerf 資料中心基準中的紀錄。

全端共同設計在交出這些最新基準成績時扮演重要角色。Blackwell 與 Blackwell Ultra 導入對 NVFP4 資料格式的硬體加速。NVFP4 是 NVIDIA 設計的 4 位元浮點格式,相較於其他 FP4 格式提供更佳準確度,也可達到與較高精度格式相當的準確度。

NVIDIA TensorRT Model Optimizer 軟體將 DeepSeek-R1、Llama 3.1 405B、Llama 2 70B 與 Llama 3.1 8B 量化為 NVFP4。搭配開源的 NVIDIA TensorRT-LLM 程式庫,這項最佳化使 Blackwell 與 Blackwell Ultra 在提交成績時能在滿足嚴格準確度要求的同時提供更高效能。

大型語言模型的推論由兩種執行特性截然不同的工作負載組成。這包括用於處理使用者輸入以產生第一個輸出詞元的情境(context),以及用於產生其後的所有輸出詞元的生成(generation)。

一種稱為「分離式服務(disaggregated serving)」的技術,會將情境與生成任務拆分,使每一部分都能獨立最佳化以達到最佳整體輸送量。這項技術是 Llama 3.1 405B Interactive 基準創下紀錄的關鍵之一。相較於在 NVIDIA DGX B200 伺服器上以傳統服務架構執行該基準時每顆 Blackwell GPU 的表現,GB200 NVL72 系統的每顆 GPU 效能提升將近 50%。

NVIDIA 也在本輪基準測試首度使用 NVIDIA Dynamo 推論框架提交成績。NVIDIA 的合作夥伴,包括雲端服務供應商與伺服器製造商,提交了採用 NVIDIA Blackwell 與(或)Hopper 平台所展現的亮眼成績。這些夥伴包含 Azure、Broadcom、Cisco、CoreWeave、Dell Technologies、技鋼科技、HPE、Lambda、Lenovo、Nebius、Oracle、雲達科技、Supermicro 及 University of Florida。

延伸閱讀

查看原始文章

更多理財相關文章

01

券商系統台積電誤植中國台灣 金管會撂重話

NOWNEWS今日新聞
02

3大電信iPhone 17資費一次看 0元購機門檻出爐

中央通訊社
03

台積電侯永清:我想跟有些人說清楚,別以為選一兩家公司去蓋晶圓廠,就可以開始做半導體了

今周刊
04

存股達人持股市值上看千萬 秘訣是「這個」

NOWNEWS今日新聞
05

差47歲!甲骨文創辦人短暫登頂世界首富 中國妻子引外界好奇

anue鉅亨網
06

10年後,目標年領100萬股利!4方法持續買好公司,整體報酬率穩健、令人滿意

幸福熟齡 X 今周刊
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...