Deepseek 傳透過「走私」取得數千顆 Nvidia 晶片用於 AI 訓練
《The Information》報導,根據六位知情人士透露,Deepseek 正使用數千顆 Nvidia 晶片訓練其下一個主要模型。
Blackwell 處理器成目標
該報導指出,這些晶片是美國法規禁止出口到中國的強大 Blackwell 處理器。消息來源稱,這些晶片首先合法運往東南亞的數據中心,Nvidia 或其合作夥伴在這些中心安裝並測試這些晶片。據稱,經銷商隨後拆卸伺服器,以虛假藉口通過海關轉移硬體,並在中國的設施重新組裝系統。據報導,該行動依賴於較小的八晶片伺服器,因為它們更容易運輸和維護。
Nvidia 回應
《彭博》向 Nvidia 詢問時,Nvidia 表示沒有證據表明《The Information》描述的所謂「幽靈數據中心」存在,但強調會跟進任何可能的走私報告。路透社報導稱,Nvidia 正在開發一項功能,以追蹤 Blackwell 晶片和未來型號的位置。如果這項技術被廣泛採用,可能會使在中國走私硬體的營運變得更加困難。
地緣政治敏感性
這種情況在政治上很敏感,原因有二。首先,這表明 Deepseek 仍然依賴高端 Nvidia 硬體來參與競爭。雖然該公司已經試用華為晶片,並且可能儲備了較舊的 Nvidia A100 和 Hopper 裝置,但據報導,新的 Blackwell 處理器對於其即將推出的模型至關重要。這些晶片包含專用硬體,旨在加速稀疏注意力,Deepseek 使用這種技術透過一次僅啟動模型的部分來降低運營成本。先前的報導表明,Deepseek 在華為晶片的性能方面遇到了困難。其次,該案例為美國政府在與北京的科技衝突中提供了更多籌碼,並削弱了中國可以將其 AI 產業快速轉向國內晶片的說法。美國議員已經在一份眾議院中國委員會的報告中將 Deepseek 標記為國家安全威脅,指責該公司違反出口規則。
NewMobileLife 網站:https://www.newmobilelife.com