請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

科技

Claude 4 正式發佈 Opus 4 力壓 Gemini 2.5 Pro

流動日報

更新於 06月05日09:49 • 發布於 05月22日21:47 • NewMobileLife

Anthropic今天宣佈推出全新模型 Claude 4 Sonnet 與 Claude 4 Opus,不僅立即於官方網站與 API 上線,還一口氣帶來重磅功能!

Claude Opus 4 力壓 Gemini 2.5 Pro 及 o3

Claude Sonnet 4 作為 Raiku 與 Opus 之間的中階模型,此次在編碼、推理與指令理解上全面超越前代 Claude Sonnet 3.7。更具話題的是旗艦級 Claude Opus 4,其性能已被 Anthropic 明確對標甚至超越 OpenAI 的 GPT-4.1、Google 的 Gemini 2.5 Pro 與 OpenAI 的 o3 模型。無論是多語言問答、工具操作能力、終端編碼還是研究所等級的推理任務,Opus 4 都展現極高水準。

https://youtu.be/oqUclC3gqKs

值得注意的是,Claude 去年在開發者中頗受歡迎,特別是在編碼任務上表現出色。但由於近期 OpenAI 與 Google 頻繁更新,Claude 一度失去領先地位。Anthropic 此次藉由 Opus 4 宣示強勢回歸,力求奪回開發者青睞。

Claude 玩 Pokémon

Google 近期展示 Gemini 2.5 Pro 完成 Pokémon Blue 通關,而 Anthropic 也不甘示弱指出,Opus 4 雖未達同一成就,但已能自主操作 Pokémon 遊戲長達 24 小時,遠遠超越前一代僅 45 分鐘的表現。這類「agentic」操作進展,顯示模型能夠在持續性任務中做出決策並記憶關鍵資訊,是邁向更高智能代理人的重要一步。

Screenshot

支援延伸思考與記憶

Anthropic 這次亦同步推出 beta 版延伸思考功能,允許模型在思考過程中使用如網路搜尋等外部工具,達成更具彈性與深度的推理。此外,模型現可同時平行使用多個工具,並能更精準理解與執行指令。在開發者允許情況下,Claude 還能存取本地檔案,萃取關鍵事實以建立長期記憶與知識延續。

Claude Code 正式上線

受研究預覽期間開發者正面回饋鼓舞,Claude Code 現已全面開放,並整合 GitHub Actions 支援背景任務。更重要的是,已原生整合至 VS Code 與 JetBrains,允許 Claude 直接在原始碼中標示與修改,強化雙人編程(pair programming)體驗。開發者甚至能在 GitHub PR 中直接 @Claude 觸發操作,讓工作流程大幅簡化。

https://youtu.be/L_WFEgry87M

API 新功能登場

Anthropic API 現新增四大功能:代碼執行工具、MCP 連接器、檔案 API 與 Prompt 快取功能(最長一小時),讓開發者更容易打造具持續記憶與多步推理能力的智能代理人(AI agents)。

Opus 4 與 Sonnet 4 均已透過 Anthropic API、Amazon Bedrock 及 Google Cloud 的 Vertex AI 提供。Opus 4 的定價為每百萬 tokens 分別為 $15(輸入)與 $75(輸出),Sonnet 4 則為 $3 與 $15,展現不同模型層級的市場定位。

NewMobileLife 網站:https://www.newmobilelife.com
Facebook:https://www.facebook.com/jetsoiphone

查看原始文章
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

留言 0

沒有留言。

最新內容

Apple HomeOS 與相關硬體有望於 2026 年 WWDC 前亮相

流動日報

政要、名流打卡點贊!廣汽攜全系新能源豪華陣容閃耀香港車博會

PR Newswire 美通社

OpenAI、Anthropic、Google 頂尖模型隨你用 Lovable 周末限時免費任試

流動日報