請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

跨越 AI 記憶體牆:儲存階層的重新分配與 HBF 剖析

科技新報

更新於 04月27日15:30 • 發布於 05月05日07:00

混合專家(MoE)架構雖能降低運算需求,但由於所有專家權重必須常駐顯存,Transformer 逐字生成特性也對記憶體頻寬提出高要求;同時,長文本應用 KV Cache 隨對話長度線性增長,龐大模型權重與動態增長的 KV Cache 分別皆對記憶體需求大幅增加,AI 運算瓶頸已從算力不足,轉向記憶體容量受限。

HBF兼具容量與成本優勢,溫數據驅動儲存階層重構

高頻寬記憶體(HBM)雖滿足速度需求,但難以兼具成本與容量平衡,透過CXL等新世代互連技術,將NAND重新定位為記憶體層級的延伸,由HBM專責即時性的熱數據,高頻寬快閃記憶體(HBF)則承接推理時代的海量溫數據需求。儲存階層的重新分配不只為了在容量與速度之間取得平衡,也可望優化總體AI硬體的成本效益。

▲ HBM與HBF規格對照。(Source:公開資料;拓墣產業研究院整理,2026.4)

先進封裝與NAND Flash固有特性為HBF商業化之關鍵

高頻寬快閃記憶體主要在解決AI推理應用的容量限制問題,HBF透過TSV堆疊與先進封裝可望實現TB級儲存,以滿足儲存模型權重與KV Cache等大容量數據需求,並最佳化大型模型推理的效能與成本。HBF有望基於HBM的製造經驗加速商業化,除了面臨先進封裝等製造的挑戰之外,亦需面對NAND Flash本身固有的特性挑戰。

(首圖來源:shutterstock)

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

AI伺服器訂單被台灣3大廠制霸!韓媒急了

NOWNEWS今日新聞
02

黃仁勳怒批AI末日論!點名矽谷CEO製造恐慌:他們覺得自己是上帝

anue鉅亨網
03

坐牢前押身家抄底一股票!出獄後一看「暴賺40000%」 資產飆破23億

太報
04

在地戲稱「台積國小」來了 5年內大樓3字頭家長搶卡位

ETtoday新聞雲
05

台股高檔投資術1/現在買0050太晚? 財務教練曝比預測股價高低更重要的事

鏡週刊
06

AI巨頭千億支出,台廠準備再吃餅?阮慕驊點破台股「過熱」真相:矽谷燒錢、亞洲變現

風傳媒
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...