輝達發表最新AI晶片 黃仁勳:可同時處理數百萬個token
美國人工智慧晶片設計龍頭輝達(NVIDIA)週二(9/9)宣布,將從明年起推出最新款AI晶片,未來可更有效率處理長文及生成影片。
根據輝達在官網公布聲明,這款新晶片名為「Rubin CPX」,將基於輝達下一代Rubin架構打造。Rubin乃輝達Blackwell架構的繼任者。
輝達指出,AI 模型處理長度1小時影片內容可能需要多達 100 萬個 token(詞元),這對傳統 GPU 來說是一個極大的挑戰。為了解決此問題,輝達將把原本冗長的處理過程中的多個步驟,如影片解碼、編碼以及 AI 模型輸出(推理)整合到新晶片「Rubin CPX」中,可以更快、更有效率地處理超長上下文推理任務,用於影片製作和軟件開發等複雜工作。
輝達執行長黃仁勳在新聞稿中說明,「Rubin CPX」是第一款專為百萬級詞元(token)處理而設計的晶片。他表示:「Vera Rubin 平台將為AI運算邁出一大步,推出下一代 Rubin GPU和一款名為CPX的全新類別處理器。正如 RTX改革了圖形運算與實體AI,Rubin CPX 是首款專為『巨量上下文 AI』打造的 CUDA GPU,模型能同時處理數百萬個 token 的知識並進行推理。
「Rubin CPX」預計明年底上市。