請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

華為憋了一年的AI大招 讓推理速度暴增90%的UCM技術是什麼?

anue鉅亨網

更新於 1小時前 • 發布於 1小時前
華為發表UCM技術,解決AI「推不動、推得慢、推得貴」三大痛點。

中國科技巨擘華為今 (12) 日在 2025 金融 AI 推理應用落地與發展論壇上正式發表 AI 推理創新技術 UCM(推理記憶資料管理器),並計劃下月正式開源 UCM。

什麼是 UCM?解決 AI 回應慢又貴的問題

想像一下,當你問 AI 問題時,它需要「思考」很久才回答,而且運算成本很高。UCM 就像給 AI 裝了一個「超強記憶系統」,讓它能更快回應、處理更長的對話,同時大幅降低成本。

華為副總裁周躍峰指出,目前 AI 推理面臨三大問題:「推不動」(輸入內容太長超出處理範圍)、「推得慢」(回應速度太慢)、「推得貴」(運算成本太高)。

UCM 透過「分層記憶」概念解決這些痛點,就像人腦會把常用資訊放在容易取得的地方,不常用的資訊存在深層記憶中。

KV Cache 技術突破 記憶容量從 GB 躍升至 PB 級

UCM 的核心是以 KV 快取 (KV Cache) 和記憶管理為中心的推理加速技術。KV 快取是 AI 模型在對話過程中儲存上下文資訊的關鍵技術,過去受限於高頻寬記憶體 (HBM) 容量,現在 UCM 能將 AI 的記憶容量提升百萬倍,從原本只能記住少量對話內容,擴展到可以記住海量的歷史資訊。

UCM 將 AI 推理系統的記憶分為三層:即時記憶資料放在 HBM 中、短期記憶資料放在 DRAM、長期記憶放在共享專業儲存中,透過智慧分級實現最佳效能。

三大技術突破 效能大幅提升

UCM 的核心技術包括三個部分:

  • 推理引擎外掛程式:像萬用轉接頭,可以連接各種不同的 AI 系統
  • 智慧快取管理:支援多級 KV 快取管理及創新加速演算法,自動決定哪些資料要放在哪個層級的記憶體中
  • 高速存取適配器:提供高效能 KV 快取存取,加速資料讀取,減少等待時間

經測試驗證,華為宣稱 UCM 能帶來顯著改善包含:一,首次回應時間最高縮短 90%;二,系統處理量最大提升 22 倍;三,可處理內容長度增加 10 倍;四,Token(AI 理解和處理文字的最小單位)經濟性提升 2 倍以上

創新聯想演算法 讓 AI 越用越聰明

UCM 還導入受打字輸入法聯想啟發的新聯想演算法,就像手機的智慧輸入功能,會根據你平常的使用習慣預測你想說什麼,讓 AI 能一次輸出多個詞彙,而不用一個字一個字慢慢生成。這項技術讓 AI「存得越多推得越快」,比傳統預測加速效果更適合企業應用場景。

華為數據儲存產品線 AI 儲存首席架構師李國杰表示,相較於業界現有方案只有傳統 Prefix Cache 技術,UCM 提供更豐富、可靠且加速效果更好的演算法庫,能在各種場景下自動切換和適應。

瞄準 Agentic AI 時代 持續技術演進

UCM 著眼於未來 Agentic AI 時代的需求設計。除了今年發布的推理加速套件,華為還將持續建構面向 Agent 知識感知的多模態檢索加速能力,以及未來 Agent 原生記憶的管理和加速能力。

李國杰透露,UCM 從去年 6-7 月開始孵化,至今約一年時間,僅演算法方面就有百人級團隊投入,未來將面向 Agentic AI 做更深入演進。

開源計畫 推動產業發展

華為計劃 9 月在魔擎社區率先開源 UCM,隨後逐步貢獻給主流 AI 開發社區。華為強調,透過開放這項技術,希望與產業界共同建立更成熟的 AI 推理生態系統。

中國信通院專家指出,目前 AI 發展重心正從「訓練模型」轉向「實際應用推理」,而 KV 快取為核心的記憶體管理將是未來 AI 系統優化的關鍵技術。

UCM 的推出標誌著 AI 推理技術邁向新階段,不僅能讓 AI 回應更快、處理能力更強,也為 AI 技術在各行業的大規模應用奠定基礎。

更多鉅亨報導
有望9月開源!華為正式發布AI推理創新技術UCM 這些晶片股迎來大利多
繞過對HBM依賴!華為矽光技術欲突破美國封鎖

點我加鉅亨網LINE好友🔥財經大事不漏接

查看原始文章

更多理財相關文章

01

一甲子醫院走入歷史!高雄邱外科3.4億賣了 買家曝光

太報
02

台灣買櫻桃變便宜了!美國櫻桃價格大跳水

自由電子報
03

震撼!台積電2027年關閉六吋廠 將產線用於先進封裝 產能要給誰

民視新聞網
04

都有重大訊息待公布! 台泥、森崴8月13日起暫停交易

太報
05

下半年保守應對 群創再推隔週休三日

鏡週刊
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
查看更多

留言 0

沒有留言。

最新消息

盤中速報 - Worldcoin大漲8.46%,報1.06美元

anue鉅亨網

盤中速報 - Dogwifhat大漲8.46%,報0.99美元

anue鉅亨網

鉅亨速報 - Factset 最新調查:昂跑控股(ONON-US)EPS預估下修至0.96元,預估目標價為56.81元

anue鉅亨網

鉅亨速報 - Factset 最新調查:Insmed IncINSM-US的目標價調升至125元,幅度約3.31%

anue鉅亨網

鉅亨速報 - Factset 最新調查:Circle Internet Group, Inc. Class A(CRCL-US)EPS預估上修至1.34元,預估目標價為192.50元

anue鉅亨網

鉅亨速報 - Factset 最新調查:Circle Internet Group, Inc. Class ACRCL-US的目標價調降至192.5元,幅度約6.1%

anue鉅亨網

美7月CPI低於預期 美股道瓊漲483點、台積電ADR漲0.91%

中廣新聞網

核心人才流向DensityAI!特斯拉壯士斷腕叫停Dojo計畫 專家:AI資源轉向更務實的應用

anue鉅亨網

盤中速報 - 雪崩代幣大漲8.36%,報24.75美元

anue鉅亨網

盤中速報 - AAVE大漲8.15%,報317.4美元

anue鉅亨網

盤中速報 - Arbitrum大漲8.35%,報0.48美元

anue鉅亨網

美國cpi符合預期「降息機率大增」! 美股、台指期盤後齊揚

民視新聞網

財經焦點/遊戲囝仔跨界半導體 大宇資凃俊光:進軍主流產業才有未來

鏡週刊

大宇資跨半導體/2個月內入主2半導體廠 大宇資董座獨家專訪揭盤算

鏡週刊

大宇資跨半導體1/相中揚智、光罩「坐在寶山上」 凃俊光感謝川普神助攻

鏡週刊

大宇資跨半導體2/揚智6年連虧31億 他砸3千萬留才直球對決拚轉型

鏡週刊

大宇資跨半導體3/繼台積聯電之後切割獨立 光罩特殊利基曝光

鏡週刊

大宇資跨半導體4/遊戲咖入主能源、半導體業累積驚人身家 凃俊光自揭成功心法

鏡週刊

〈美股盤後〉CPI燃起降息希望 標普那指齊創新高

anue鉅亨網

美通膨數據推升降息期望 美股收紅道瓊大漲近500點

中央通訊社

市場評估美俄元首會談影響 國際油價收低

中央通訊社

信用卡繳學費免手續費 銀行加碼優惠一次看

卡優新聞網

銀行內鬼盜刷信用卡 3大漏洞開鍘1200萬元

卡優新聞網

上半年平均月薪25年新高 薪資兩極化現象嚴重

卡優新聞網

前7月稅收年減2.1% 證交稅年跌24%最多

卡優新聞網

盤中速報 - 波卡幣大漲8.18%,報4.21美元

anue鉅亨網

盤中速報 - 萊特幣大漲8.1%,報130.63美元

anue鉅亨網

盤中速報 - SOL大漲8.37%,報191.03美元

anue鉅亨網

盤中速報 - 以太幣大漲8.8%,報4,603.08美元

anue鉅亨網

繞過對HBM依賴!華為矽光技術欲突破美國封鎖

anue鉅亨網

盤中速報 - 費城半導體大漲3.01%,報5840.79點

anue鉅亨網

盤中速報 - 艾達幣大漲8.36%,報0.8493美元

anue鉅亨網

群聯發表整合 aiDAPTIV+ 技術之英特爾架構 AI PC 筆電方案

科技新報

盤中速報 - Onto Innovation Inc.(ONTO-US)大漲5.02%,報109.91美元

anue鉅亨網

輝達、超微交保護費換出口許可開先例!白宮擬擴大「抽成」模式

anue鉅亨網

外匯速報 - 歐元/加幣(EURCAD) 大漲0.48%,報1.6081元

anue鉅亨網

盤中速報 - 科斯塔集團(CSGP-US)大跌5.02%,報87.86美元

anue鉅亨網

延續 A16 銷售神話!三星 Galaxy A17 5G 輕薄機身搭配 5,000mAh 大電量還有 5,000 萬畫素 OIS 光學防手震主鏡頭

ifans 林小旭

盤中速報 - 英特爾(INTC-US)大漲5.06%,報21.7美元

anue鉅亨網