請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

輝達發布 Nemotron 3 Super模型 具備 1200 億參數的開放模型

信傳媒

更新於 03月12日14:38 • 發布於 03月12日14:35 • 鄭國強
NVIDIA Nemotron 3 Super模型,這是一款具備 1200 億參數的開放模型,其中包含 120 億個活躍參數(active parameters),專為大規模運行複雜的代理型 AI 系統而設計。(圖片來源/輝達提供)

NVIDIA 於12日推出 NVIDIA Nemotron 3 Super模型,這是一款具備 1200 億參數的開放模型,其中包含 120 億個活躍參數(active parameters),專為大規模運行複雜的代理型 AI 系統而設計。

此模型現已開放使用,結合先進推理能力,可讓自主代理以高效率完成任務並維持高準確度。

AI 原生企業:Perplexity 已為其用戶提供 Nemotron 3 Super,用於搜尋功能,並將其作為 Computer 產品中 20 個協作模型之一。提供軟體開發代理的公司,如 CodeRabbit、Factory 與 Greptile,也正將該模型與自家模型整合至 AI 代理中,以降低成本並同步提升準確度。此外,Edison Scientific 與 Lila Sciences等生命科學與頂尖 AI 機構,則將運用 Nemotron 3 Super 模型驅動其代理系統,用於深度文獻搜尋、資料科學研究,以及分子層級的理解任務。

企業軟體平台:Amdocs、Palantir、Cadence、達梭系統與西門子等業界領導廠商正在部署並客製化 Nemotron 3 Super 模型,用於電信、資安、半導體設計與製造等領域的工作流程自動化。

隨著企業從聊天機器人邁向多代理應用,正面臨兩大主要限制。

首先是情境膨脹(context explosion)問題。多代理工作流程所產生的詞元數量,可能是一般聊天互動的 15 倍,因為每次互動都必須重新傳送完整歷史紀錄,包括工具輸出與中間的推理過程。

在處理時間較長的任務中,龐大的情境資料量會增加成本,且可能導致代理偏離原始目標。

第二項是思考稅(thinking tax)。複雜代理需要在每個步驟進行推理,但若是每個子任務都使用大型模型,將使多代理應用成本過高且運行緩慢,難以在實務環境中部署。

Nemotron 3 Super 提供 100 萬個詞元的情境窗口,使代理能將完整工作流程狀態保留在記憶中,進而避免目標偏移。

Nemotron 3 Super 亦樹立全新效能標準,在效率與開放性方面於 Artificial Analysis 評比中排名第一,並在同級模型中展現領先的準確度。

該模型也同時讓 NVIDIA AI-Q 研究代理在 DeepResearch Bench 與 DeepResearch Bench II 排行榜上榮登榜首。這兩項基準測試皆用於衡量 AI 系統在處理大型文件集時,進行全面多步驟研究,並維持推理連貫性的能力。

延伸閱讀

查看原始文章

更多理財相關文章

01

張淑芬透露張忠謀腳比較好了 黃仁勳曾專程1天來回探望

自由電子報
02

前財長顏慶章愛女病逝!川普關稅台美談判關鍵推手顏慧欣驟逝 享年53歲

三立新聞網
03

勞工別再繳錢!「2職業工會」積欠保費 勞保局出手了

三立新聞網
04

快訊/群創突發重訊!出售南科廠房給矽品 獲利58億

三立新聞網
05

噩耗!台美貿易談判推手顏慧欣辭世 卓榮泰:深感遺憾

自由電子報
06

4月從台積電退休!宏碁獨董提名赫見「何麗梅」  施振榮才讚:將步入人生另一階段

太報
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...