重點一 :輝達(NVIDIA)提出「AI工廠」(AI Factory)概念,將AI開發流程比擬為工業生產,強調將數據轉化為智慧的規模化生產。
重點二 :AI工廠需具備強大的硬體基礎,包含GPU、DPU和高速網路,以應對生成式AI對運算資源的指數級需求。
重點三 :輝達提供完整的軟體堆疊,從CUDA到AI Enterprise和Omniverse,簡化AI開發和部署流程。
在近期舉行的NVIDIA GTC大會上,「AI工廠」成為高管和講者頻繁提及的熱門詞彙。輝達執行長黃仁勳在其長達兩小時的主題演講中,更將此概念推向高峰。
什麼是AI工廠?
要從技術上理解AI工廠概念,很容易被各種術語混淆。 但其實,AI工廠的本質就是一個專門用來處理大量資料並產生智慧的超級電腦或資料中心。
黃仁勳在2023年首次提出這個概念時表示:「輝達正在打造AI工廠,接收數據(data),並生產智慧(intelligence)。」這個比喻將複雜的技術過程形象化, 就像傳統工廠將「原材料」轉化為「產品」,AI工廠則是將「數據」轉化為「智慧和解決方案」。
需要特別強調的是, AI工廠並非製造業中的智慧工廠,而是專門為企業提供AI所需算力的基礎設施。 根據輝達的說明, AI工廠是一種搭載最新GPU晶片和軟體的運算基礎設施,專門用於精煉大量資料的人工智慧模型。
數據到智慧:AI工廠的運作模式
AI處理的兩大階段
要理解AI工廠如何運作,我們需要先了解AI處理的兩大關鍵階段:
- 訓練(Training)或學習(Learning)階段 :在這個階段,AI工廠會將大量資料輸入電腦,找出規則,建立模型。這個過程需要極大的運算資源,例如ChatGPT的語料訓練需要超過1萬個處理器跑1個月,成本約3,000萬美金。
- 推論(Inference)或預測(Prediction)階段 :建立模型後,AI工廠會利用這個模型來預測或生成新的內容。相較於訓練階段,推論所需的時間和資源較少,但仍然需要一定的運算能力。
這兩個階段就像人類「學習英文」和「使用英文」的差別,學習需要花費數年時間(訓練),但一旦掌握後,與外國人交談只需幾秒鐘(推論)。
AI工廠的數據處理流程
在AI工廠中,數據處理遵循以下流程:
- 數據收集與輸入 :大量的原始數據被輸入到AI工廠中。
- 數據處理與學習 :超級電腦處理這些數據,讓AI模型從中學習模式和規律。
- 模型訓練與優化 :通過多次迭代,AI模型不斷改進和優化。
- 智慧輸出與應用 :經過訓練的模型可以生成各種類型的智慧成果,如預測、決策或創意內容。
AI工廠vs智慧工廠:兩個不同的概念
很多人容易混淆AI工廠和智慧工廠這兩個概念,但它們實際上有著根本的區別:
AI工廠:產生智慧的數據中心
- 主要功能:處理數據並生成智慧或解決方案。
- 物理形態:超級電腦、資料中心或GPU運算基礎設施。
- 輸出產品:經訓練的AI模型、預測、決策支援或創意內容。
- 適用場景:任何需要大規模AI運算的企業或組織。
智慧工廠:應用科技的現代製造設施
- 主要功能:運用先進技術實現生產過程的自動化、智慧化與數據化。
- 物理形態:實體製造工廠,但導入了物聯網、AI等技術。
- 輸出產品:實體製造產品,但生產過程更高效、靈活。
- 適用場景:製造業企業尋求提升生產效率和產品品質。
黃仁勳特別強調,他提出的AI工廠是為企業提供AI需要的算力基礎設施,而不是製造業生產線所謂的智慧工廠。
AI工廠,不只是硬體而已
僅有硬體是不夠的。輝達的AI工廠願景,還包括端到端的軟體堆疊,以充分利用這種基礎設施。
基礎是CUDA,輝達的平行運算平台和程式設計模型,讓開發人員能夠利用GPU加速。CUDA和CUDA-X函式庫(用於深度學習、數據分析等)已成為GPU運算的通用語言,使構建在輝達硬體上高效運行的AI演算法變得更加容易。
在此基礎之上,輝達提供NVIDIA AI Enterprise,一個雲端原生軟體套件,旨在簡化企業的AI開發和部署,整合了100多個框架、預訓練模型和工具,所有這些都針對輝達GPU進行最佳化,並整合到一個具有企業級支援的統一平台中。
輝達的軟體堆疊還包括用於管理和協調AI工廠運作的工具。例如,NVIDIA Base Command和Run:AI等合作夥伴的工具,有助於跨叢集排程作業、管理數據和監控多使用者環境中的GPU使用情況。
另一個關鍵要素是NVIDIA Omniverse,是一個模擬和協作平台,讓創作者和工程師能夠構建數位雙生,即具有物理精確模擬的真實世界系統的虛擬副本。
針對AI工廠,輝達推出了Omniverse Blueprint for AI Factory Design and Operations,使工程師能夠在部署硬體之前,在虛擬環境中設計和最佳化AI資料中心。
有哪些企業應用AI工廠?
1. 鴻海
應用方式 :鴻海與輝達合作,在其台灣和墨西哥工廠中部署AI工廠技術。透過輝達的Omniverse平台和Isaac機器人技術,鴻海打造工廠的數位孿生模型,進行AI驅動的模擬和生產線優化。
具體成果 :AI工廠幫助鴻海提升智慧製造能力,預計每年可節省超過30%的能源成本,並降低整體運營費用。台灣工廠計劃於2024年12月投產,墨西哥工廠則預計於2025年初啟動。
2. 特斯拉(Tesla)
應用方式 :特斯拉運營一個專用的GPU集群,作為其AI工廠,用於訓練自動駕駛AI模型。這個集群處理從特斯拉車輛收集的大量行車資料,並將其轉化為改進Autopilot和全自動駕駛(FSD)系統的AI模型。
具體成果 :透過AI工廠的不斷運作,特斯拉能夠持續優化其自動駕駛技術,提升系統的安全性和性能,並將更新後的模型推送至車輛。
延伸閱讀:momo年收創新高、年增率卻寫新低!為什麼?富邦媒總經理揭2大關鍵因素
本文初稿為AI編撰,整理.編輯/ 李先泰
延伸閱讀
蘋果WWDC敲定6/9登場!iOS 19、iPadOS 19⋯將迎盛大改版,還有哪些亮點活動?
TWQR是什麼?支援哪些電子支付?LINE Pay可以用嗎?TWQR懶人包來了
「加入《數位時代》LINE好友,科技新聞不漏接」