1 美元取代 70 美元系統?DeepSeek V3.1 發布,劍指企業 AI 成本痛點
DeepSeek 宣布對其舊有的 V3 模型進行更新,表示增強版本已準備好進行測試,更新後的 V3.1 擁有更長的上下文視窗,代表模型能夠維持更長的對話,具備更佳的記憶能力。《Bloomberg》報導,DeepSeek 的模型展現中國公司能以相對低廉的成本,在 AI 領域取得進展,今年稍早推出的 R1 模型,在多項標準化測試中超越數個西方對手,令全球震驚。
低成本高性能?混合架構打破 AI「樣樣不精」魔咒
《VentureBeat》指出,DeepSeek V3.1 的發布不僅是 AI 能力漸進提升,且象徵著一種根本性轉變「全球最先進的 AI 系統如何被開發、分發與掌控,對美中持續的科技競爭產生深遠影響。」
在 Hugging Face 上架短短數小時內,DeepSeek V3.1 就迅速攀升熱門排行榜,並獲得全球研究者的讚譽,爭相下載與測試其功能。《VentureBeat》提及,該模型在著名的 Aider 程式碼測試基準中取得 71.6% 的分數,成為表現出色的模型之一,挑戰美國 AI 巨頭的領先地位。
DeepSeek V3.1 在工程設計上展現驚人成就,重新定義人們對 AI 模型表現的期待,它能處理高達 128,000 tokens 的上下文,相當於一本 400 頁的書,同時保持極快的回應速度,遠勝於其他較慢的推理型競爭者。該模型支援多種精度格式,從標準的 BF16 到實驗性的 FP8,讓開發者能依硬體條件最佳化效能。
此次的突破在於 DeepSeek 所謂的「混合架構」。與過去嘗試結合不同 AI 功能卻往往導致「樣樣不精」不同,V3.1 能將聊天、推理與程式碼功能無縫整合於單一模型中。
AI 研究員 Andrew Christianson 在 X 上發文:「DeepSeek V3.1 在 Aider 上拿到 71.6%,非推理類最佳成績,比 Claude Opus 4 高 1%,但便宜 68 倍。」DeepSeek V3.1 完成一項完整程式碼任務的成本僅 1.01 美元,卻能達到市面上近 70 美元等值系統的成果,對每天使用 AI 工作的企業用戶而言,影響數百萬美元的成本差異。
AI 公共財 vs 智慧財產權,美中科技巨頭策略相異
《VentureBeat》提及,DeepSeek 的發布時機精準,僅在 OpenAI 推出 GPT-5 與 Anthropic 發布 Claude 4 之後數週。透過性能上的並駕齊驅與開源的開放性,「DeepSeek 直接挑戰美國 AI 領導地位背後的商業模式基礎。」
這一策略涵義遠不止於技術規格。美國公司嚴格管控先進系統,要求高額 API 費用並施加使用限制,而 DeepSeek 卻讓全球免費下載、修改與部署。
《VentureBeat》指出,這種理念上的差異,反映了兩大強權在技術發展上的不同思維。OpenAI 與 Anthropic 將模型視為需被保護和變現的「智慧財產」,而中國公司則愈來愈多地將先進 AI 視為能透過廣泛開放加速創新的「公共財」。
*本文開放合作夥伴轉載,資料來源:《Bloomberg》、《VentureBeat》,圖片來源:Unsplash。