請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

新模型 R2 延後主因!DeepSeek 嘗試華為晶片失敗,還是得靠 NVIDIA

科技新報

更新於 1小時前 • 發布於 1小時前

中國人工智慧(AI)公司 DeepSeek 在嘗試使用華為晶片訓練新模型失敗後,延後新一代模型的發布,這也凸顯北京推動取代美國技術的困難。

知情人士透露,DeepSeek 在 1 月發布 R1 模型後,受到官方鼓勵,改採用華為昇騰(Ascend)處理器,而非 NVIDIA 系統。

然而,在使用昇騰晶片進行 R2 訓練過程中持續遇到技術問題,因此改回 NVIDIA 晶片進行訓練,僅在推理(Inference)階段使用華為晶片。知情人士透露,這是模型發布從 5 月延後的主要原因,導致 DeepSeek 在競爭中落後。

所謂「訓練」是模型透過大量資料集中學習,「推理」則利用已訓練好的模型進行預測或產生回應。由此可知,中國晶片在關鍵任務上仍落後美國競爭對手,這也是中國追求半導體自給自足所面臨的挑戰。

外媒《金融時報》(FT)指出,北京已要求中國科技公司必須為訂購 NVIDIA H20 晶片提供正當理由,藉此推廣華為、寒武紀(Cambricon)等國產替代方案。

業界人士認為,與 NVIDIA 產品相比,中國晶片存在穩定性問題、晶片間連線速度較慢,以及軟體水準較差等劣勢。

據悉,華為曾派出一支工程師團隊前往 DeepSeek 辦公室,協助利用其 AI 晶片開發 R2 模型。但即使如此,DeepSeek 仍無法在昇騰晶片上成功完成一次訓練。不過,DeepSeek 與華為合作改為將模型在推理(Inference)階段能相容於昇騰晶片。

知情人士透露,DeepSeek 創辦人梁文峰在內部表達對 R2 進展不滿,並努力投入更多時間打造更先進模型,以維持公司在 AI 領域的領先地位。R2 發布延後的原因還包括更新模型所需的資料標註時間比預期更長,根據中媒報導,該模型有望在未來數週內發布。

加州大學柏克萊分校 AI 研究員 Ritwik Gupta 認為,將昇騰用於訓練這方面,華為正在經歷「成長痛」,但預期它最終會適應,「我們今天還沒看到用華為訓練的領先模型,不代表未來不會發生。這只是時間問題」。

(首圖來源:Unsplash

立刻加入《科技新報》LINE 官方帳號,全方位科技產業新知一手掌握!

查看原始文章

更多理財相關文章

01

價值7.1億!全球央行「最大金磚」在台灣 央行:220公斤獲世界認證

太報
02

「新護國神山是它!」專家看股價翻漲8成表現:外資眼中的AI基建核心台廠

風傳媒
03

發錢了!年輕人符合3條件 最高可領4萬5

EBC 東森新聞
04

覺得價格太高又在買,專家:股市大傻瓜出現

科技新報
05

退休金在職就能領?勞退新制申請條件公開 公司不幫辦、二度就業有錢拿嗎

風傳媒
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
查看更多

留言 0

沒有留言。

最新消息

支援繁體中文!HTC 首款 AI 眼鏡亮相

科技新報

外匯速報 - 美元/瑞郎(USDCHF) 大漲0.5%,報0.8089元

anue鉅亨網

川普蒲亭峰會在即 歐股收紅

中央通訊社

盤中速報 - ether.fi大跌9.33%,報1.19美元

anue鉅亨網

盤中速報 - Worldcoin大跌8.3%,報1.01美元

anue鉅亨網

盤中速報 - Bonk大跌8.68%,報0美元

anue鉅亨網

盤中速報 - 狗狗幣大跌8.36%,報0.22236美元

anue鉅亨網

鉅亨速報 - Factset 最新調查:Cheniere Energy Inc.(LNG-US)EPS預估下修至12.43元,預估目標價為270.00元

anue鉅亨網

盤中速報 - Dogwifhat大跌9.87%,報0.93美元

anue鉅亨網

盤中速報 - UNI大跌8.35%,報11美元

anue鉅亨網

Google 宣布最新奧克拉荷馬州投資案,擴建雲端與 AI 基礎設施

科技新報

焦點速報 - 美元指數(DXY) 大漲0.41%,報98.243點

anue鉅亨網

輝達中國銷售恐季繳7億美元稅 投資人信心不減

anue鉅亨網

MM行事曆

財經M平方行事曆

外匯速報 - 美元/墨西哥披索(USDMXN) 大漲1.17%,報18.8253元

anue鉅亨網

馬斯克罕見盛讚 Google 為 AI 領導者,xAI 手握 120 億美元迎戰

科技新報

「這波主升段的主升段一定要掌握!」杜金龍曝投資機會:整體氣溫已做出來

風傳媒

投資人不用等!富蘭克林華美投信 7 檔基金首推「基金轉換 T+1」服務

科技新報

Apple Watch Ultra 3 推出時程近了?有望解決與 Series 10 規格落差

科技新報

蘋果 Vision Pro 2 搭載的晶片可能比想像中好

科技新報

外匯速報 - 美元/韓元(USDKRW) 大漲0.78%,報1390.51元

anue鉅亨網

美7月PPI超預期飆高!Fed大降息2碼沒戲了 預料僅降1碼

anue鉅亨網

踢足球機器人(圖)

中央通訊社

擂台機器人(圖)

中央通訊社

世界人形機器人運動會開幕式(圖)

中央通訊社

彈鋼琴機器人(圖)

中央通訊社

世界人形機器人運動會北京開幕 武術踢球走秀紛登場

中央通訊社

韓國遊戲廠攜手智冠 MyCard 支付!〈阿瑞斯〉第四季台港澳上線

科技新報

盤中速報 - GTC大跌22.37%,報0.413美元

anue鉅亨網

還在等著領股息?「這方法」才是資產升級關鍵

民視新聞網

【快報】關稅影響來襲!高頻儀表板帶你掌握全球變化

財經M平方短評

長和:出售港口交易需時將更長 2025年不會完成

中央通訊社

美CPI低於預期「Fed降息」呼聲高 台積電再創高

民視新聞網

盤中速報 - 交易台(TTD-US)大跌5.26%,報51.5美元

anue鉅亨網

周五阿拉斯加峰會後川普、普丁將召開聯合記者會

anue鉅亨網

AI 資安解方!CloudMile 萬里雲成為台灣 Google SecOps 白金級 MSSP

科技新報

標榜MIT!宏達電AI眼鏡亮相 力拚小米、META

EBC 東森新聞

比特幣創新高後遇PPI打壓回落 分析師:上漲動能未盡

anue鉅亨網

電競需求帶動今年 OLED 監視器出貨年增 86%,占比北美降、歐洲/中國升

科技新報