請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

科技

WEKA 推出 NeuralMesh Axon,用於百億億次級人工智能部署

PR Newswire 美通社

更新於 6小時前 • 發布於 7小時前 • PR Newswire

新產品提供獨特融合架構,業界領先人工智能先驅企業(例如 Cohere、CoreWeave 和 NVIDIA 等)正在利用此架構,實現突破性效能提升,並降低大規模人工智能訓練和推理工作負載的基礎設施要求

巴黎和加州坎貝爾 2025年7月9日 /美通社/ -- 自 RAISE SUMMIT 2025:WEKA 推出 NeuralMesh Axon,這是個突破性儲存系統。該系統利用創新融合架構,旨在解決百億億次人工智能應用程式和工作負載的運行基本挑戰。NeuralMesh Axon 無縫融合 GPU 伺服器和人工智能工廠,從而簡化部署、降低成本,並顯著增強人工智能工作負載的回應能力和效能,轉變未充分利用的 GPU 資源為統一兼高效能的基礎設施層。

WEKA's NeuralMesh Axon delivers an innovative fusion architecture designed to address the fundamental challenges of running exascale AI applications and workloads.

WEKA's NeuralMesh Axon delivers an innovative fusion architecture designed to address the fundamental challenges of running exascale AI applications and workloads.

新產品以該公司最近發佈的 NeuralMesh 儲存系統為基礎,該系統透過強大嵌入式功能,增強容器化微服務架構,協助人工智能先驅、人工智能雲端和雲端新秀服務供應商加速大規模人工智能模型發展,特別是它結合 NVIDIA AI Enterprise 軟體堆疊時,實現高級模型訓練和推理最佳化。NeuralMesh Axon 還支援即時推理,顯著改善第一個權杖時間和整體權杖流通量,協助客戶更迅速地將創新推向市場。

每秒百億億次運算下,人工智能基礎設施障礙的複合性能
是大型語言模型 (LLM) 訓練和推理工作負載的成敗關鍵,尤其是在極端規模運行時。那些機構在倚靠繁重複製方法的傳統儲存架構上,運行大量人工智能工作負載。這除了浪費 NVMe 容量,也面對嚴重低效率的問題,並難以應付不可預測的效能和資源分配。

哪些原因?傳統架構的設計,並非為了即時處理和儲存大量資料。它們在數據工作流和人工智能工作流程中,製造延遲和瓶頸,這能阻礙百億億次人工智能部署。未充分利用的 GPU 伺服器和過時的數據架構,將優質硬體變成閒置資本,造成訓練工作負載出現高昂代價的停機時間。推理工作負載面對記憶體限制障礙,包括鍵-值 (KV) 快取和熱數據,導致降低流通量和增加基礎設施壓力。有限 KV 快取卸載容量造成數據存取瓶頸,而傳入提示的資源分配變得複雜,直接影響營運支出和洞察時間。許多機構正在轉用 NVIDIA 加速運算伺服器,並搭配 NVIDIA AI Enterprise 軟體,應對這些挑戰。然而,由於他們缺乏現代儲存整合,而仍然會遇到重大工作流效率和整體 GPU 利用率限制。

專為全球最大兼最高要求加速運算環境而建
為了應付這些挑戰,NeuralMesh Axon 的高效能兼彈性儲存結構,透過利用本機 NVMe、備用 CPU 核心及其現有網絡基礎架構,直接整合至加速運算伺服器。這種統一兼軟體定義的運算和儲存層,為本地和遙距工作負載提供一致微秒延遲——超過 NFS 等傳統本地協定。

此外,當利用 WEKA 的增強記憶體網格功能時,它可以為大規模的 KV 快取負載,提供近乎記憶體的速度。這有別於浪費聚合容量和故障時崩潰的繁重複製方法,NeuralMesh Axon 的獨特抹除碼設計可容許最多四個節點同時遺失,在重建期間維持完全流通量,並支援跨現有 NVMe、CPU 核心和網絡資源的預先定義資源分配——轉換隔離磁碟為百億億次級及以上的類似記憶體的低延遲儲存池,同時向全部可定址數據,提供一致低延遲存取。

在百億億次級運算下,雲端服務供應商和人工智能創新者需要能夠配對模型複雜性和資料集大小呈指數成長的基礎設施解決方案。NeuralMesh Axon 專為處於人工智能創新前沿的機構設計,這些機構需要即時、極大規模效能,而非隨著時間逐漸擴展。這包括建立人工智能服務的人工智能雲端供應商和雲端新秀、區域人工智能工廠、為企業客戶開發人工智能解決方案的主要雲端供應商,以及部署最高要求人工智能推理和訓練解決方案的大型企業機構。這些機構必須靈活擴展和最佳化自身的人工智能基礎設施投資,而支援迅速的創新週期。

提供改變遊戲規則的效能,加速人工智能創新
早期採用者,包括業界領先兼安全第一企業人工智能公司 Cohere,已經看到轉型成果。

Cohere 是 WEKA 首批部署 NeuralMesh Axon 的客戶之一,支援客戶的人工智能模型訓練和推理工作負載。Cohere 面對高昂創新成本、資料傳送瓶頸和未充分利用 GPU,率先於公有雲中部署 NeuralMesh Axon,從而統一人工智能堆疊和簡化操作。

Cohere 工程副總裁 Autumn Moulder 表示:「對於人工智能模型建構者來說,速度、GPU 最佳化和成本效益是任務關鍵。這表示更少硬件,生成更多權杖,並運行更多模型——而毋需等待容量或遷移數據。嵌入 WEKA 的 NeuralMesh Axon 至我們的 GPU 伺服器中,協助我們盡量提升利用率,並加速我們的人工智能工作流的每一步。效能提升已改變遊戲規則:過去推理部署需時五分鐘,現在可以於 15 秒內完成,檢查點速度提升 10 倍。我們的團隊現在可以不斷疊代,並以前所未有的速度,將完全創新人工智能模型(例如 North 等)推向市場。 」

該公司為了改善培訓和幫助發展 Cohere 的安全人工智能代理平台 North,正在 CoreWeave Cloud 上部署 WEKA 的 NeuralMesh Axon。這創建堅實基礎來支援即時推理,並為 Cohere 的最終客戶提供卓越體驗。

CoreWeave 技術總監兼共同創辦人 Peter Salanki:「我們正在進入人工智能進步超越原始運算的時代——它是由智能基礎設施設計爆發的。CoreWeave 正在透過消除限制人工智能規模發展的複雜性,而重新定義人工智能先驅的可能。我們透過無縫整合 WEKA 的 NeuralMesh Axon 至 CoreWeave 的人工智能雲端基礎設施,而正在直接賦予數據處理能力,實現微秒延遲,從而減少 I/O 等待時間,並為單個 GPU 伺服器提供超過 30 GB/s 的讀取速度、12 GB/s 寫入速度和 100 萬 IOPS。這種突破性方法提高 GPU 利用率,並為 Cohere 提供效能基礎。他們需要打破推理速度障礙,並為客戶提供先進人工智能解決方案。」

NVIDIA 解決方案架構和工程副總裁 Marc Hamilton 表示:「人工智能工廠正在定義基於 NVIDIA 加速運算和我們的 NVIDIA 雲端合作夥伴生態系統建構的人工智能基礎設施的未來。機構透過大規模最佳化推理和,並於靠近 GPU 的地方嵌入超低延遲 NVMe 儲存,而可以釋放更多頻寬和擴展可用 GPU 記憶體為任何容量。我們與 CoreWeave 一起部署的合作夥伴解決方案(例如 WEKA 的 NeuralMesh Axon),為加速推理提供關鍵基礎,同時帶來卓越效能和成本效益,協助新一代人工智能服務。 」

融合儲存和運算對人工智能創新的好處
NeuralMesh Axon 為百億億次級人工智能建構者和雲端服務供應商,帶來即時兼可量度的改進,包括:

  • 擴展記憶體配加速權仗流通量:提供 WEKA 增強記憶體網格技術的緊密整合,透過利用它為權仗倉庫來擴展 GPU 記憶體。在多個客戶部署中,這提升第一個權仗效能 20 倍,從而實現更大上下文窗口,並顯著提高推理密集型工作負載的權仗處理效率。此外,NeuralMesh Axon 協助客戶動態調整運算和儲存資源,並無縫支援即時訓練和即時推理。
  • 巨大 GPU 加速和效率提升:客戶透過 NeuralMesh Axon 而實現顯著效能和 GPU 利用率提升,人工智能模型訓練工作負載超過 90%——較行業平均水平高三倍。NeuralMesh Axon 還降低機房數據中心所需的機架空間、電力和冷卻要求,透過利用現有伺服器資源,協助降低基礎設施成本和複雜性。
  • 立即擴充大規模人工智能工作流程:專為需要立即實現極端規模(而非隨著時間而成長)的人工智能創新者設計。NeuralMesh Axon 的容器化微服務架構和雲端原生設計,協助機構獨立地擴展儲存效能和容量,同時保持混合和多雲環境一致效能特徵。
  • 協助團隊專注建立人工智能,而非基礎設施:在混合和雲端環境中無縫運行,並整合現有 Kubernetes 和容器環境,從而無需外部儲存基礎設施並降低複雜性。

WEKA 產品總監 Ajay Singh 表示:「百億億次人工智能面臨的基礎設施的挑戰,有別於業界過去面對的任何挑戰。在 WEKA,我們看到很多機構在訓練期間面對 GPU 利用率低和推理期間 GPU 過載的問題,而每個模型和代理的人工智能成本卻高達數百萬美元。這就是我們設計 NeuralMesh Axon 的原因,它源於我們深度關注從 GPU 開始的每層人工智能基礎設施最佳化。現在,人工智能為先的機構可以在百億億次級及更高規模運作中,實現具有競爭力人工智能創新所需的效能和成本效益。 」

可用性
NeuralMesh Axon 目前僅向大型企業人工智能和雲端新秀客戶限量提供,預計將於 2025 年秋季全面上市。如欲更多資料,請瀏覽:

  • 產品網頁:
  • 解決方案簡介:
  • 網誌文章:

關於 WEKA
WEKA 正在透過其智能自適應網格儲存系統 NeuralMesh™,改變機構建立、運作和擴展人工智能工作流程的方式。NeuralMesh 有別於(隨著人工智能環境擴展而變得更脆弱)傳統數據基礎設施,而隨著規模擴大而變得更迅速、更強大兼更有效率。它隨著您的人工智能環境而成長,為企業人工智能和代理式人工智能創新提供靈活基礎。NeuralMesh 獲 30%《財富》雜誌 50 強企業和全球領先雲端新秀和人工智能創新者信賴。它可最大化 GPU 利用率,加速取得首個權杖,並降低人工智能創新的成本。如欲了解更多,請瀏覽 或追蹤我們的 LinkedIn 和 X。

WEKA 和 W 標誌乃 WekaIO, Inc. 的註冊商標,而此處其他商品名稱可能是其各自擁有人的商標。

WEKA: The Foundation for Enterprise AI

WEKA: The Foundation for Enterprise AI

查看原始文章

Super X AI Technology Limited任命孫和安為首席技術官,推動下一代全棧式AI基礎設施發展

PR Newswire 美通社

ViewSonic 以科技實踐永續,共創《永續好日子》綠色展會行動

PR Newswire 美通社

「THE ROAD RACE TOKYO TAMA 2025」將於2025年7月13日在東京舉辦

PR Newswire 美通社
查看更多
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

最新內容

「Amazon Prime Day」期間「UGREEN」充電器等產品最高可享50%OFF!與原神聯名的充電器也在促銷陣容內

Saiga NAK

Samsung 推出超薄 Galaxy Z Fold7 系列摺疊手機

流動日報

「牧場物語 來吧!風之繁華市集」第二彈前瞻公開!同步舉行贈送「微風手提扇」公開紀念活動!

Saiga NAK

「REJECT GEAR」EWC官方授權遊戲滑鼠墊「FENON Esports World Cup 2025 Limited Edition」現已接受預訂!

Saiga NAK

REJECT粉絲必看!REJECT SFL2025壯行会8月9日舉行!選手穀子等你來,和你的主推選手一起拍照!

Saiga NAK

Mac 出貨量突飛猛進 全球市佔率大幅提升

流動日報

新書揭示亞太百強學校:16所香港學校入榜,國際課程展現優勢

PR Newswire 美通社

HBO Max 強勢回歸 告別 Max 品牌兩年實驗

流動日報

以「Pokémon Sleep」中所登場的寶可夢為設計靈感的絨毛布偶將於7月12日上市!還將發送可獲得三巨頭的薰香的貼紙

Saiga NAK

一年一度的大促銷「Amazon Prime Day2025」開跑!智慧型手錶與可攜式電源等促銷對象的推薦小工具介紹

Saiga NAK

「碧色萬里:10-12世紀的草原絲綢之路」展即將在中國絲綢博物館開幕

PR Newswire 美通社

Apple 據報正積極洽購 Formula 1 串流轉播權

流動日報

海信推出116英寸UX電視,RGB-MiniLED技術實現驚艷色彩精度

PR Newswire 美通社

Apple Pencil 將能跨越螢幕限制 在任何表面上書寫

流動日報

「CAPCOM Pro Tour 2025 世界戰士 日本大賽」報名開始!同步舉辦現場觀賽活動

Saiga NAK

FP Markets 慶祝其作為全球交易領域值得信賴的品牌成立 20 週年

PR Newswire 美通社

ARK 深度解讀:如何鏈接全球頂尖管理人並建立長期合作?

PR Newswire 美通社

ARK 新加坡總部喬遷啟航,開拓全球華人財富藍海

PR Newswire 美通社

ARK Japan 連袂東京之星銀行,為全球華人提供本地化財富管理服務

PR Newswire 美通社

ARK Wealth 榮膺「香港最佳財富管理機構」,多元化戰略獲國際權威認可

PR Newswire 美通社

生而全球----ARK Wealth斬獲財管行業「奧斯卡」級獎項

PR Newswire 美通社

南方東英於韓國首爾舉辦「香港--韓國資本市場論壇」,財政司司長陳茂波向韓國機構投資者全方位推介香港優勢

PR Newswire 美通社

未來資產推出Global X中國核心科技ETF(3448) 聚焦中國創新領軍企業

PR Newswire 美通社

Xiaomi 16全球版現身EEC數據庫 預計最快9月上市!

am730

人氣實況主「SHAKA」加入職業電競戰隊「ZETA DIVISION」!並與豐田子公司Toyota Konic Pro株式會社簽署夥伴關係協議

Saiga NAK

OPPO突破性新機曝光 8000mAh超大電池竟可壓縮至8mm超薄機身!

am730

IShowSpeed直播驚現Mate XT三摺疊神機 HUAWEI真愛粉確認!

am730

設計大改動成焦點,SAMSUNG Galaxy Watch8 及 Watch8 Classic 官方宣傳圖意外曝光!

Mobile Magazine

OPPO突破性新機曝光,8000mAh 超大電池竟可壓縮至 8mm 超薄機身!

Mobile Magazine

IBM推出AI 就緒的服務器 Power11 ,重新定義企業 IT 標準

PR Newswire 美通社

IShowSpeed 真愛無疑!直播驚現 HUAWEI Mate XT 三摺疊神機

Mobile Magazine

台灣創新力量Startup Island TAIWAN進軍大阪!

PR Newswire 美通社

氣候變遷吹響警報! 2035前近⅓半導體產業陷銅荒

VOCO News

「THE ROAD RACE TOKYO TAMA 2025」將於2025年7月13日在東京舉辦

PR Newswire 美通社

「東京遊戲展2025」公開參展企業!超越去年,達到歷史最大規模

Saiga NAK

思百博 (Spiber) 攜手荷蘭高定設計師Iris van Herpen亮相2025秋冬巴黎高級定制時裝周,發布先鋒婚禮造型

PR Newswire 美通社

「Red Bull LEGENDUS STREET FIGHTER 6 頂」活動現場報導!除了比賽本身之外,現場還有豐富多樣的娛樂內容可以盡情享受!

Saiga NAK

內部程式碼洩露 揭示 Apple 全新晶片陣容涵蓋 iPhone 到 HomePod mini

流動日報

Apple 重大高層人事變動 Jeff Williams 卸任 COO

流動日報