迫於內部壓力 DeepSeek採用華為晶片出包 新AI模型延後發布
英國《金融時報》報導,匿名消息人士透露,中國人工智慧新創公司DeepSeek持續遭遇「技術問題」,被迫推遲下一代人工智慧(AI)模型的發布。
這問題源自於中國官員敦促DeepSeek使用中國晶片製造商華為研製的昇騰處理器,而不是輝達晶片,來訓練R2模型。 DeepSeek使用輝達晶片進行模型訓練,並使用華為晶片進行推理(AI生成結果的環節),這些問題是DeepSeek備受期待的R2新模型發布時間從5月往後推遲的主要原因。
華為晶片持續出現技術問題
這個重大的挫折凸顯中國晶片在關鍵領域仍落後於美國競爭對手,也凸顯出中國科技公司仍然需要輝達的原因。
中國人工智慧公司DeepSeek使用華為昇騰(Ascend)晶片,由於華為晶片持續出現技術問題,DeepSeek無法成功進行訓練,因而推遲新AI模型的發布,這凸顯中國AI開發公司在減少對輝達等美國技術的依賴,所面臨的困難與挑戰。
DeepSeek及AI新創同業早些時候在北京的鼓勵下使用華為的昇騰晶片,北京此舉的背景是美國管制AI晶片出口,成為今年主要爭議焦點。
先前,北京也以國家安全為由,要求中國國內科技巨頭說明輝達晶片訂單的合理性。
但是業內人士坦言,與輝達的產品相比,中國製造的晶片存在穩定性問題,也存在晶片之間連接速度較慢以及軟體品質較差問題,可能導致中國企業在人工智慧競賽方面失利。
北京對輝達晶片訂單的規定嚴格
就在幾天前,華盛頓與AI晶片巨頭輝達(Nvidia)敲定一項史無前例的協議,美國財政部允許輝達和AMD對中國外銷H20晶片,交換條件是政府抽取15%的銷售額。
批評人士警告,H20將「加速」中國的人工智慧發展,但是DeepSeek的困境暴露另一個問題:AI新創公司面臨「購買中國本土產品」的政治壓力,但是中國最優秀的實驗室在關鍵時刻仍會選擇美國硬體。
北京規定科技公司需要證明輝達的每一筆訂單都是合理的,而華盛頓方面願意授權銷售,這與其說是矛盾,不如說是競爭。
中國正在努力縮小與美國AI技術的差距。而美國在努力保持差距,保持強大,以發揮影響力。在這場遊戲中,美國不僅想成為最堅固的城堡,也根本不想有競爭對手。
即使H20降級,也比華為晶片好用
業內人士指出,對於全球資料中心來說,即使運行降級版的美國輝達晶片,其效能也比運行中國華為晶片更好,速度更快。
北京方面對美國製造的暉達晶片在中國關鍵AI研發的頻繁使用表示安全擔憂,因此,華為和中國政府大力推廣昇騰系列晶片。
但是輝達的H20晶片仍是中國最受歡迎的人工智慧晶片。美國已將華為昇騰系列晶片列入黑名單,理由是華為在開發這款晶片時使用受限制的美國技術。
今年稍早震撼全球的中國AI新創公司DeepSeek R1模型主要以輝達H20晶片為基礎開發上市。其他中國主要人工智慧開發人員也在使用H20晶片,包括位字節跳動、騰訊控股和阿里巴巴集團。
留言 0