在美國4月進一步限制輝達H20晶片對中國出口前,中國科技巨頭字節跳動、阿里巴巴以及騰訊已囤積總值逾120億美元、約100萬顆H20晶片,以應對AI運算需求激增,還有未來供應中斷的風險。中國業者除提前備貨外,也積極尋求海外採購以及國產替代方案,如華為新發表的CloudMatrix 384。
《日經亞洲》獨家報導,據消息人士透露,在美國今年4月實施最新出口限制前,字節跳動、阿里巴巴與騰訊從去年起,就已預料美國有可能對H20也實施限制,早就開始提前部署,至少已囤積價值幾十億美元的輝達H20人工智慧(AI)晶片。H20圖形處理器(GPU)是專門針對中國市場設計、以符合美國出口管制要求的晶片
1位知情人士透露,這3家公司要求輝達盡快出貨約100萬顆H20晶片,相當於1年的供貨量,最好能在今年5月底前交貨。不過,最後實際到貨量未達100萬顆, 因為川普政府4月初宣布這些晶片也需要出口許可。另1位消息人士則指出,這些搶購訂單總價值超過120億美元,其中幾十億美元的晶片已在新限制生效前完成出貨。
據兩名知情人士透露,字節跳動是搶購輝達晶片最積極的公司之一。這波搶購行動正值中國國內對AI運算能力的需求激增,特別是自新創AI公司DeepSeek出現以來。2月時,騰訊將DeepSeek整合進自家的「超級App」微信後,對算力的需求大增。
1位中國科技公司高層表示:「H20被限制出口其實並不意外,業界早有預期。所有中國大型科技公司都已提前備貨,畢竟當時H20還沒被禁,又效能不錯,當然非搶不可。」
H20是輝達H100的兩次降規版本,H100最早於2022年第3季問世。為應對當年美國出口限制,輝達推出了針對中國市場的H800晶片,後來美方進一步收緊限制,輝達又再度降級為H20。H20於2024年上半年正式發售,它的AI訓練效能約為H100的1/10,推論(inference)能力僅約兩成,雖然如此,H20在中國市場仍非常受歡迎。推論指的是AI模型根據訓練結果,作出預測或生成內容的過程。
除了提前下單,中國企業也尋求在中國境外購買輝達晶片,來避開美國出口限制。多位業界人士透露,這些企業正研究設立海外子公司或分支機構,或與電信業者等產業夥伴合作,以持續獲取AI硬體資源。有供應商高層表示他近日與字節跳動和阿里雲會晤時,這些(中國)客戶表現得很冷靜,他們早有心理準備,也早就備好貨,今年要擴建更多資料中心的目標不變。
除了中國和香港,阿里巴巴在13個國家設有資料中心,其中包括美國的兩個,而字節跳動則在東南亞與歐洲多國擁有機房,像是愛爾蘭和挪威。
與此同時,中國的資料中心業者也正加速驗證華為等國產GPU平台的進度。多位知情人士透露,華為在4月初發表最新AI運算解決方案「CloudMatrix 384」,這項方案可串接384顆華為自研的昇騰晶片,號稱可與輝達的高階GB200 NVL72相抗衡。
駐香港的AI工程師Eugene Lee表示,雖然H20表面上是訓練用GPU,其實配置更適合用於推論,不像H100和H800那樣偏重訓練效能。因此,若H20短缺,還能用國產替代品或雲端方案應急,對中小型模型影響有限,但如果是大型模型的部署及優化,就會面臨更大挑戰。
他坦言,目前許多大型AI模型仍仰賴先前採購的H100和H800進行訓練,大部分雲端服務供應商也使用H100和H800來提供推論服務。如果H100和H800的存量用盡,將嚴重阻礙中國發展先進模型,還有次世代系統的能力,對中國高端AI的競爭力構成實質威脅。
輝達也警告,H20出口限制只會讓競爭對手受益,因為中國客戶勢必尋求國內或海外替代方案。輝達15日表示,預計本季將因此損失55億美元營收。在這項聲明發布後,輝達執行長黃仁勳意外造訪北京,向中國官員表示將「盡全力」持續服務中國市場。
根據輝達財報,截至2024年1月26日止的財政年度,中國市場占其總營收13.1%,低於前1年的近17%。相較之下,新加坡的比重則由11.2%升至18%。不過這些數字是依據客戶開立發票的地點計算,輝達也說明,許多客戶雖將發票集中開在新加坡,但實際出貨地並非當地,按實際出貨計算,新加坡營收僅占其總體不到2%。