新模型 R2 延後主因！DeepSeek 嘗試華為晶片失敗，還是得靠 NVIDIA

更新於 1小時前 • 發布於 1小時前

中國人工智慧（AI）公司 DeepSeek 在嘗試使用華為晶片訓練新模型失敗後，延後新一代模型的發布，這也凸顯北京推動取代美國技術的困難。

知情人士透露，DeepSeek 在 1 月發布 R1 模型後，受到官方鼓勵，改採用華為昇騰（Ascend）處理器，而非 NVIDIA 系統。

然而，在使用昇騰晶片進行 R2 訓練過程中持續遇到技術問題，因此改回 NVIDIA 晶片進行訓練，僅在推理（Inference）階段使用華為晶片。知情人士透露，這是模型發布從 5 月延後的主要原因，導致 DeepSeek 在競爭中落後。

所謂「訓練」是模型透過大量資料集中學習，「推理」則利用已訓練好的模型進行預測或產生回應。由此可知，中國晶片在關鍵任務上仍落後美國競爭對手，這也是中國追求半導體自給自足所面臨的挑戰。

外媒《金融時報》（FT）指出，北京已要求中國科技公司必須為訂購 NVIDIA H20 晶片提供正當理由，藉此推廣華為、寒武紀（Cambricon）等國產替代方案。

業界人士認為，與 NVIDIA 產品相比，中國晶片存在穩定性問題、晶片間連線速度較慢，以及軟體水準較差等劣勢。

據悉，華為曾派出一支工程師團隊前往 DeepSeek 辦公室，協助利用其 AI 晶片開發 R2 模型。但即使如此，DeepSeek 仍無法在昇騰晶片上成功完成一次訓練。不過，DeepSeek 與華為合作改為將模型在推理（Inference）階段能相容於昇騰晶片。

知情人士透露，DeepSeek 創辦人梁文峰在內部表達對 R2 進展不滿，並努力投入更多時間打造更先進模型，以維持公司在 AI 領域的領先地位。R2 發布延後的原因還包括更新模型所需的資料標註時間比預期更長，根據中媒報導，該模型有望在未來數週內發布。

加州大學柏克萊分校 AI 研究員 Ritwik Gupta 認為，將昇騰用於訓練這方面，華為正在經歷「成長痛」，但預期它最終會適應，「我們今天還沒看到用華為訓練的領先模型，不代表未來不會發生。這只是時間問題」。

DeepSeek’s next AI model delayed by attempt to use Chinese chips

（首圖來源：Unsplash）

立刻加入《科技新報》LINE 官方帳號，全方位科技產業新知一手掌握！

留言 0

沒有留言。

請更新您的瀏覽器啟用Javascript

科技新報

更多理財相關文章

價值7.1億！全球央行「最大金磚」在台灣 央行：220公斤獲世界認證

「新護國神山是它！」專家看股價翻漲8成表現：外資眼中的AI基建核心台廠

發錢了！年輕人符合3條件 最高可領4萬5

覺得價格太高又在買，專家：股市大傻瓜出現

退休金在職就能領？勞退新制申請條件公開 公司不幫辦、二度就業有錢拿嗎

查看更多科技新報

覺得價格太高又在買，專家：股市大傻瓜出現

2.5 億年前大滅絕原因找到，研究：雨林崩潰導致暖化 500 萬年

全球 AI 獨角獸爆炸成長，這些公司高層成為超級富豪

需求成長 vs. 供電挑戰，8/23 核三延役公投引關注

留言 0

最新消息

支援繁體中文！HTC 首款 AI 眼鏡亮相

外匯速報 - 美元/瑞郎(USDCHF) 大漲0.5%，報0.8089元

川普蒲亭峰會在即 歐股收紅

盤中速報 - ether.fi大跌9.33%，報1.19美元

盤中速報 - Worldcoin大跌8.3%，報1.01美元

盤中速報 - Bonk大跌8.68%，報0美元

盤中速報 - 狗狗幣大跌8.36%，報0.22236美元

鉅亨速報 - Factset 最新調查：Cheniere Energy Inc.(LNG-US)EPS預估下修至12.43元，預估目標價為270.00元

盤中速報 - Dogwifhat大跌9.87%，報0.93美元

盤中速報 - UNI大跌8.35%，報11美元

Google 宣布最新奧克拉荷馬州投資案，擴建雲端與 AI 基礎設施

焦點速報 - 美元指數(DXY) 大漲0.41%，報98.243點

輝達中國銷售恐季繳7億美元稅 投資人信心不減

MM行事曆

外匯速報 - 美元/墨西哥披索(USDMXN) 大漲1.17%，報18.8253元

馬斯克罕見盛讚 Google 為 AI 領導者，xAI 手握 120 億美元迎戰

「這波主升段的主升段一定要掌握！」杜金龍曝投資機會：整體氣溫已做出來

投資人不用等！富蘭克林華美投信 7 檔基金首推「基金轉換 T+1」服務

Apple Watch Ultra 3 推出時程近了？有望解決與 Series 10 規格落差

蘋果 Vision Pro 2 搭載的晶片可能比想像中好

外匯速報 - 美元/韓元(USDKRW) 大漲0.78%，報1390.51元

美7月PPI超預期飆高！Fed大降息2碼沒戲了 預料僅降1碼

踢足球機器人(圖)

擂台機器人(圖)

世界人形機器人運動會開幕式(圖)

彈鋼琴機器人(圖)

世界人形機器人運動會北京開幕 武術踢球走秀紛登場

韓國遊戲廠攜手智冠 MyCard 支付！〈阿瑞斯〉第四季台港澳上線

盤中速報 - GTC大跌22.37%，報0.413美元

還在等著領股息？「這方法」才是資產升級關鍵

【快報】關稅影響來襲！高頻儀表板帶你掌握全球變化

長和：出售港口交易需時將更長 2025年不會完成

美CPI低於預期「Fed降息」呼聲高 台積電再創高

盤中速報 - 交易台(TTD-US)大跌5.26%，報51.5美元

周五阿拉斯加峰會後川普、普丁將召開聯合記者會

AI 資安解方！CloudMile 萬里雲成為台灣 Google SecOps 白金級 MSSP

標榜MIT！宏達電AI眼鏡亮相 力拚小米、META

比特幣創新高後遇PPI打壓回落 分析師：上漲動能未盡

電競需求帶動今年 OLED 監視器出貨年增 86%，占比北美降、歐洲／中國升

請更新您的瀏覽器

價值7.1億！全球央行「最大金磚」在台灣　央行：220公斤獲世界認證

發錢了！年輕人符合3條件最高可領4萬5

退休金在職就能領？勞退新制申請條件公開　公司不幫辦、二度就業有錢拿嗎

川普蒲亭峰會在即　歐股收紅

輝達中國銷售恐季繳7億美元稅投資人信心不減

美7月PPI超預期飆高！Fed大降息2碼沒戲了預料僅降1碼

世界人形機器人運動會北京開幕武術踢球走秀紛登場

美CPI低於預期「Fed降息」呼聲高　台積電再創高

標榜MIT！宏達電AI眼鏡亮相力拚小米、META

比特幣創新高後遇PPI打壓回落分析師：上漲動能未盡