請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

震撼!輝達NVFP4格式突破4位元極限 AI訓練效率翻倍

anue鉅亨網

更新於 2小時前 • 發布於 2小時前
圖:Pixabay/Unsplash/Pexel

輝達 (NVDA-US) 發布其突破性的 NVFP4 浮點格式,宣稱能以 4 位元(4-bit)的速度與效率,實現 16 位元(16-bit)的訓練精準度。這項技術的問世,不僅標誌著大型語言模型(LLM)開發的重大飛躍,更為 AI 訓練的未來開啟了全新的篇章。

過去,AI 訓練主要依賴 16 位元或 32 位元的高精度浮點格式。儘管後訓練量化(PTQ)已證明 4 位元量化能顯著提升推理吞吐量,但在要求極高穩定性和收斂性的預訓練階段,模型仍不得不依賴 BF16 或 FP8 等更高精度格式。

然而,AI 訓練是極其耗費運算資源、電力和時間的過程。在有限的預算和 GPU 週期下,如何最大化訓練效率,成為所有 AI 開發者面臨的核心挑戰。

輝達發布的 NVFP4 技術,正是為了解決這一痛點。透過將模型權重和活化值的精度降低到僅 4 個位元,NVFP4 能顯著減少記憶體需求、提升算術運算吞吐量,並優化通訊效率。

這使得 AI 工廠能夠在相同的硬體配置下,處理更多的數據和代幣,從而加速收斂週期,並支援更大規模模型的快速開發,最終擴展 AI 所能達到的前沿領域。

輝達為 NVFP4 開發了一套專用的預訓練方法,旨在解決大規模訓練中的動態範圍、梯度波動和數值穩定性等核心挑戰。其關鍵技術包括:

微區塊縮放(Micro-block Scaling):輝達 Blackwell 架構原生支援 NVFP4 格式。與先前的 MXFP4 格式不同,NVFP4 將微區塊大小從 32 個元素減少到 16 個,讓每一小組元素共享一個共同的縮放因子。這種更精細的粒度設計,能最大限度地減少異常值的影響,降低量化誤差,並大幅提升整體模型準確性。

E4M3 高精度區塊編碼:縮放因子的精確度對於量化品質至關重要。NVFP4 採用更高精度的 E4M3 縮放因子,並帶有額外的尾數位,相較於 MXFP4 僅限於 2 的冪次方(E8M0),這使得數值表示更為精準,能更好地利用有限的量化區間。

張量分佈重塑:預訓練期間的梯度和活化值往往帶有較大的異常值,這會影響低精度量化。輝達透過對 GEMM(通用矩陣乘法)輸入應用哈達瑪變換(Hadamard transforms),將張量分佈重塑為更接近高斯分佈的形態。這種方法能平滑異常值,使張量更容易被準確表示,並在整個訓練過程的前向和後向傳播中保持透明。

量化保真度維持:為確保訓練的穩定性與效率,NVFP4 技術採用了能夠在前向傳播與後向傳播之間保持一致性的量化方法。例如,選擇性二維塊式量化等技術,有助於在整個訓練週期中維持張量表示的對齊,最大程度地減少信號失真,並增強整體穩健性。

隨機舍入(Stochastic Rounding):與傳統的確定性舍入不同,隨機舍入確保梯度以機率方式隨機向上或向下舍入,其機率與數值距離兩個可表示值之間的距離成正比。這一步驟對於減少舍入偏差,維持訓練期間的梯度流至關重要。

●支援兆級代幣規模完整預訓練

為驗證 NVFP4 的效能,輝達在一個類似於 NVIDIA Nemotron Nano 2 的 120 億參數混合 Mamba-Transformer 模型上進行了實驗。該模型在一個包含 10 兆代幣的大規模數據集上進行了完整的預訓練。

實驗結果顯示,使用 NVFP4 從頭開始訓練的 12B 模型,其收斂曲線與作為基準的 FP8 模型高度吻合,且在訓練過程中沒有出現通常困擾超低精度訓練的不穩定或發散問題。這證明了 NVFP4 支援兆級代幣規模完整預訓練的能力。

此外,輝達將使用 NVFP4 預訓練的模型與 FP8 基準模型在一系列下游任務和智慧領域進行了比較。結果表明,NVFP4 的性能在所有領域都與 FP8 不相上下,證明了其有效性與可靠性。

輝達正與亞馬遜雲端科技(AWS)、Cohere、Google 雲端、Kimi AI、微軟 AI、Mistral、OpenAI、Perplexity、Reflection 和 Runway 等領先組織積極合作,共同探索 NVFP4 的潛力,將更加鞏固其在 AI 技術領域的領先地位,也預示著未來 AI 訓練將邁向一個更高效、更節能的 4 位元時代。

更多鉅亨報導
輝達營收超預期 奈何「缺少中國」與資料中心放緩引發股價下挫
高盛點評輝達財報:業績穩健 但市場預期高 股價面臨壓力

點我加鉅亨網LINE好友🔥財經大事不漏接

查看原始文章

更多理財相關文章

01

和泰車16.5萬輛年銷售目標不變,如何做到逆勢成長? 看美國車零關稅,車市龍頭這麼說

今周刊
02

房市慘澹!有錢人也不買單「200萬俱樂部」掰了…他揭賣不動真相

5168實價登錄比價王
03

誰賣的?台積電最後一盤爆5668張賣單下殺15元 終場收1160元重挫30元

經濟日報
04

聯強也來3+1 輝達背板股閃金光 股價漲停鎖死「還了公道」

工商時報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
轉發 (0)
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
查看更多

最新消息

印地安Indian Chieftain與Challenger雙雄並峙,性能與自由的極致共鳴!

SiCAR愛車酷

MIDO瑞士美度表Prime-Time Event 2025盛大揭幕全球首發 Multifort TV Chronograph 計時碼錶系列泰國首次亮相

SiCAR愛車酷

職涯攜手 一鹿相伴! 桃市府就職處9月份7場徵才活動陸續登場

商傳媒

新應材、南寶、信紘科合資5億 成立新公司

NOWNEWS今日新聞

不知道怎麼買車?跟著趨勢走就對了!2024年全球最暢銷10款汽車

SiCAR愛車酷

BMW集團已交出第300萬輛新能源車,誰說沒有純電宣言賣不好車?

SiCAR愛車酷

柏林愛樂攜首席指揮 Kirill Petrenko 首度獻演台灣Mercedes-Benz 與牛耳藝術共同呈獻殿堂級藝術盛事

SiCAR愛車酷

LEXUS ELECTRIFIED 全球350萬台榮耀限量主題活動,邀您探索電動化的無限可能

SiCAR愛車酷

雄獅:歐洲市場擔綱營運黑馬(圖)

中央通訊社

國發會啟動「創業大聯盟競賽」 單隊最高可獲1,000萬

中央廣播電臺

台積電衝刺1.4奈米製程 投資上看1.5兆元、穩固龍頭地位

商傳媒

卓揆要金融貸款「水龍頭開大點」 公股銀紛表態

中央廣播電臺

鉅亨買幣速報 - 以太幣(ETH)24小時成交量超過24.35億美元,BETA(BETA)24小時漲幅達64%

anue鉅亨網

台灣諾基亞劉明達:接洽緊急救難、醫院合作

NOWNEWS今日新聞

衛福部次長呂建德喊話蔣萬安:希望每一分錢都能花在刀口上

新頭殼

BTCC 贊助紅鷹傳奇高爾夫日,愛華頓主帥莫耶斯出席

Knowing

雄獅:歐洲團訂單能見度達明年6月 看好連假效益

中央通訊社

GoPro 對決 DJI?運動相機 GoPro 傳出將在 2026 年推出 Vlog 專用相機

三嘻行動哇 Yipee!

中央大學攜手英特爾、華碩成立AI PC創新實驗室 合作群聯推動AI教育

anue鉅亨網

劉鏡清繳成績單 國發會:前七月公建達成率45.6% 執行3680億元創18年新高

anue鉅亨網

外匯速報 - 美元/人民幣(USDCNY) 大跌0.3%,報7.1322元

anue鉅亨網

基金經理:如果金銀比回到長期均值 白銀有望突破每盎司50美元

anue鉅亨網

全新Santa Fe Calligraphy 七人座油電休旅非凡品味頂級客製 豪華 SUV 新標竿

SiCAR愛車酷

國發會公布,7月景氣對策信號續呈綠燈,綜合判斷分數持平29分

財訊快報

盤後速報 - 伍豐(8076)次交易(29)日除息1.1元,參考價26.5元

anue鉅亨網

盤後速報 - 能率(5392)次交易(29)日除權息0.65元,參考價41.72元

anue鉅亨網

盤後速報 - 信立(4303)次交易(29)日除權息3元,參考價68.42元

anue鉅亨網

盤後速報 - 夆典(3052)次交易(29)日除息0.5元,參考價11.75元

anue鉅亨網

盤後速報 - 凱基金(2883)次交易(29)日除權0.1元,參考價15.4元

anue鉅亨網

盤後速報 - 燿華(2367)次交易(29)日除息0.7元,參考價30.75元

anue鉅亨網

盤後速報 - 毛寶(1732)次交易(29)日除息0.5元,參考價28.75元

anue鉅亨網

盤後速報 - 欣巴巴(9906)下週(9月4日)除息6.5元,預估參考價64.2元

anue鉅亨網

盤後速報 - LINEPAY(7722)下週(9月4日)除息1.5元,預估參考價613.5元

anue鉅亨網

盤後速報 - 騰雲(6870)下週(9月4日)除權0.2元,預估參考價195.1元

anue鉅亨網

盤後速報 - 久昌(6720)下週(9月4日)除權息5.4元,預估參考價110.53元

anue鉅亨網

盤後速報 - 亞翔(6139)下週(9月4日)除息13.89元,預估參考價335.61元

anue鉅亨網

盤後速報 - 泰博(4736)下週(9月4日)除息10元,預估參考價132.5元

anue鉅亨網

盤後速報 - 宏致(3605)下週(9月4日)除息0.72元,預估參考價73.18元

anue鉅亨網

盤後速報 - 磐儀(3594)下週(9月4日)除息0.8元,預估參考價43.95元

anue鉅亨網

盤後速報 - 華晶科(3059)下週(9月4日)除息1元,預估參考價49.3元

anue鉅亨網