請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

科技

阿里巴巴 Qwen3-Coder 可與 Claude Sonnet 4 媲美

流動日報

更新於 1小時前 • 發布於 23小時前 • NewMobileLife

阿里巴巴已推出Qwen3-Coder,這是其迄今最先進的 AI 編碼模型,旨在與西方領先的模型在程式設計任務上直接競爭。

模型架構與大規模訓練

Qwen3-Coder 是 Qwen3 系列的最新成員,該系列於 4 月由阿里巴巴推出,用於通用 AI 應用。阿里巴巴將此編碼版本描述為其迄今最「自主代理」的模型,旨在處理複雜的多步驟開發工作流程。其旗艦型號 Qwen3-Coder-480B-A35B-Instruct 採用專家混合架構,擁有 4,800 億個參數,其中 350 億個可同時啟用。該模型原生支援高達 256,000 個 token 的上下文視窗,並可選擇擴展至 100 萬個。

阿里巴巴以 7.5 兆個 token 的龐大資料集訓練 Qwen3-Coder,其中程式碼佔 70%。為準備這些資料,阿里巴巴使用其先前的 Qwen2.5-Coder 模型來清理並重寫訓練語料庫。在後續訓練中,阿里巴巴應用了長期強化學習,透過與環境的多階段互動,教導模型使用工具並處理回饋。阿里巴巴在 Alibaba Cloud 上建立了可運行 20,000 個並行環境的基礎設施,以支援此方法。

可與 Claude Sonnet 4 媲美

阿里巴巴表示 Qwen3-Coder 在需要物理定律推理的任務上表現出色,這是編碼模型的常見基準。根據阿里巴巴的說法,該模型在基於代理的編碼、瀏覽器自動化和工具使用方面,其成績可與 Claude Sonnet 4 媲美。

在用於軟體工程任務的 SWE-Bench Verified 基準測試中,Qwen3-Coder 在開源模型中展現了最先進的性能,值得注意的是,它無需依賴測試時縮放(通常在推論期間需要額外的計算資源)。Avi Chawla 進一步比較了 Qwen3-Coder 和 Claude Sonnet 4 在十項 MCP 伺服器開發任務中的表現,結果 Qwen3-Coder 在九個案例中勝出,持續取得更高的正確性分數。

以 Gemini Code 為基礎

與新模型同時發布的還有 Qwen Code,這是一款供開發者使用的命令列工具。Qwen Code 以 Gemini Code 為基礎,但針對 Qwen3-Coder 進行了最佳化,更新了提示詞和函數呼叫協議,並支援 OpenAI SDK 和環境變數配置。Qwen3-Coder 還能與現有的開發者工具無縫整合;例如,搭配 Claude Code 使用時,需要從 Alibaba Cloud Model Studio 取得 API 金鑰。

阿里巴巴計畫推出更多不同規劃的 Qwen3-Coder 模型,以在降低部署成本的同時提供強勁性能。阿里巴巴也在探索編碼代理是否能隨時間自我改進。儘管 480B 模型對於標準 GPU 來說過大,但可透過 Alibaba Cloud Model Studio 取得 API 存取權。

開源替代方案

這次發布將 Qwen3-Coder 定位為 Anthropic 和 Google 等公司專有編碼助理的開源替代方案,使其有別於大多數西方競爭對手。鑒於編碼任務通常涉及處理大量程式碼庫或文件,API 成本可能迅速增加,有時會迫使用戶訂閱昂貴的服務。Qwen3-Coder 強大的開源性能可能會對這些供應商構成價格壓力。

NewMobileLife 網站:https://www.newmobilelife.com

查看原始文章

OpenAI 主席:別燒錢訓練 AI 模型 成本高貶值快

流動日報

Google 搭建無限乒乓對戰場 兩隻 AI 機械臂自我進化不間斷

流動日報

OpenAI 預備 8 月發佈 GPT-5 將大幅提升程式編碼能力

流動日報
查看更多
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

最新內容

iPhone 17 Pro 傳聞將具備超過 5 倍光學變焦及 Pro 相機應用程式

TECH RITUAL

Claude Code 宣佈引入每週使用時數限制 每周 40 至 80 小時防止濫用

流動日報

Redmi 15C 5G 規格及圖片洩露

TECH RITUAL

Samsung 獲 Tesla 165 億美元晶片大單 馬斯克親自監督生產

流動日報

Samsung 限制 One UI 8 設備的 開機器鎖 解鎖功能

TECH RITUAL

Samsung Galaxy S26 Ultra 新功能及規格預告

TECH RITUAL

Samsung Galaxy A17 首度曝光,預示預算型手機新選擇

TECH RITUAL

Tesla 暗示可能推出更小型的皮卡車

TECH RITUAL

Oppo 發佈 AI 驅動的售後服務系統

TECH RITUAL

M4 MacBook Air 降價至 $799,創新低價吸引買家

TECH RITUAL

SanDisk 推出專為 iPhone 設計的便攜式 SSD,適合戶外攝影與錄影使用

TECH RITUAL

新款 iPhone 或將對 Samsung Galaxy S26 Ultra 的相機性能形成競爭

TECH RITUAL

Samsung Galaxy A07 和 A17 獲得更多認證,F17 出現在支援頁面中

TECH RITUAL

iPhone 17 Pro 可能迎來全新相機升級與功能改進

TECH RITUAL

Samsung Galaxy Tab 將獲得 Blender 應用程式以便捷進行 3D 創作

TECH RITUAL

vivo V60 預告活動啟動,電池容量及顏色曝光

TECH RITUAL

Baseus EnerCore CR11 20000mAh 67W 輕便筆記本電源銀行評測

TECH RITUAL

Huawei 在 2025 年第二季重返中國市場首位

TECH RITUAL

Galaxy Z Flip 7 可能是未來幾年內最大的設計更新

TECH RITUAL

2025智博會在蘇州開幕 聚焦人工智能產業創新

PR Newswire 美通社

Google Pixel 10 系列預期不會大改 但仍有吸引的改變

流動日報

Meizu 22 預告擁有全球最纖薄的顯示器邊框

TECH RITUAL

Apple iOS 26 的 Liquid Glass 設計語言全平台統一更新

TECH RITUAL

Galaxy Z Fold 7 輕薄設計兼具耐用性

TECH RITUAL

Redmi Note 14 SE 正式發佈,外觀與規格相似

TECH RITUAL

健絡通 x TEEMTONEfai 兩大本地品牌破天荒跨界聯乘Cool住迎接香港足球盛會「健絡通盃」

PR Newswire 美通社

平安金融壹賬通金新明出席《財富》AI大會:未來金融的發展,需要依托「混合式AI」以實現信任與可控

PR Newswire 美通社

Nothing Phone (3)旗艦手機實測 Glyph Matrix點陣介面玩轉樽

am730

SuperX宣布計劃在日本建立AI供應中心,強化一站式解決方案交付能力

PR Newswire 美通社

S Pen 的未來懸而未決 Samsung 調整策略引發用戶關注

流動日報

BYD攜手Samsung打造智能出行新體驗 Galaxy Watch化身數碼車匙!

am730

Galaxy Z Fold7 耐用性測試結果分析

TECH RITUAL

閱文集團將於2025年8月12日公佈2025年上半年業績

PR Newswire 美通社

Quantum Solutions與TDX Strategies達成戰略合作,進一步深化比特幣儲備部署

PR Newswire 美通社

鄧白氏 亮相香港金管局「數據峰會2025」 聚焦中小企信貸分析與數據應用新視角

PR Newswire 美通社

HONOR細屏旗艦新機將轉用天璣9500或 藉此打造更輕薄高效能產品

am730

「寶可夢」×「31冰淇淋」的聯名活動將於8月1日起開跑!另附有寶可夢設計的保冷袋套裝組合也將登場

Saiga NAK

摩理都株式會社攜手52 BY HIKARUMATSUMURA推出首款聯名包袋,紀念《新世紀福音戰士》動畫播出30週年

PR Newswire 美通社

vivo Y400 發佈:搭載 Snapdragon 685 處理器及 6,000mAh 電池

TECH RITUAL

「卟啵電競!異世界語音2025」開賣!以「異世界」為主題的情境語音登場

Saiga NAK