Claude 4 正式發佈　Opus 4 力壓 Gemini 2.5 Pro

Anthropic今天宣佈推出全新模型 Claude 4 Sonnet 與 Claude 4 Opus，不僅立即於官方網站與 API 上線，還一口氣帶來重磅功能！

Claude Opus 4 力壓 Gemini 2.5 Pro 及 o3

Claude Sonnet 4 作為 Raiku 與 Opus 之間的中階模型，此次在編碼、推理與指令理解上全面超越前代 Claude Sonnet 3.7。更具話題的是旗艦級 Claude Opus 4，其性能已被 Anthropic 明確對標甚至超越 OpenAI 的 GPT-4.1、Google 的 Gemini 2.5 Pro 與 OpenAI 的 o3 模型。無論是多語言問答、工具操作能力、終端編碼還是研究所等級的推理任務，Opus 4 都展現極高水準。

https://youtu.be/oqUclC3gqKs

值得注意的是，Claude 去年在開發者中頗受歡迎，特別是在編碼任務上表現出色。但由於近期 OpenAI 與 Google 頻繁更新，Claude 一度失去領先地位。Anthropic 此次藉由 Opus 4 宣示強勢回歸，力求奪回開發者青睞。

Claude 玩 Pokémon

Google 近期展示 Gemini 2.5 Pro 完成 Pokémon Blue 通關，而 Anthropic 也不甘示弱指出，Opus 4 雖未達同一成就，但已能自主操作 Pokémon 遊戲長達 24 小時，遠遠超越前一代僅 45 分鐘的表現。這類「agentic」操作進展，顯示模型能夠在持續性任務中做出決策並記憶關鍵資訊，是邁向更高智能代理人的重要一步。

Screenshot

支援延伸思考與記憶

Anthropic 這次亦同步推出 beta 版延伸思考功能，允許模型在思考過程中使用如網路搜尋等外部工具，達成更具彈性與深度的推理。此外，模型現可同時平行使用多個工具，並能更精準理解與執行指令。在開發者允許情況下，Claude 還能存取本地檔案，萃取關鍵事實以建立長期記憶與知識延續。

Claude Code 正式上線

受研究預覽期間開發者正面回饋鼓舞，Claude Code 現已全面開放，並整合 GitHub Actions 支援背景任務。更重要的是，已原生整合至 VS Code 與 JetBrains，允許 Claude 直接在原始碼中標示與修改，強化雙人編程（pair programming）體驗。開發者甚至能在 GitHub PR 中直接 @Claude 觸發操作，讓工作流程大幅簡化。

https://youtu.be/L_WFEgry87M

API 新功能登場

Anthropic API 現新增四大功能：代碼執行工具、MCP 連接器、檔案 API 與 Prompt 快取功能（最長一小時），讓開發者更容易打造具持續記憶與多步推理能力的智能代理人（AI agents）。

Opus 4 與 Sonnet 4 均已透過 Anthropic API、Amazon Bedrock 及 Google Cloud 的 Vertex AI 提供。Opus 4 的定價為每百萬 tokens 分別為 $15（輸入）與 $75（輸出），Sonnet 4 則為 $3 與 $15，展現不同模型層級的市場定位。

NewMobileLife 網站：https://www.newmobilelife.com
Facebook：https://www.facebook.com/jetsoiphone

請更新您的瀏覽器

科技

流動日報

Claude Opus 4 力壓 Gemini 2.5 Pro 及 o3

Claude 玩 Pokémon

支援延伸思考與記憶

Claude Code 正式上線

API 新功能登場

留言 0

最新內容

Apple HomeOS 與相關硬體有望於 2026 年 WWDC 前亮相

政要、名流打卡點贊！廣汽攜全系新能源豪華陣容閃耀香港車博會

OpenAI、Anthropic、Google 頂尖模型隨你用　Lovable 周末限時免費任試

請更新您的瀏覽器啟用Javascript

Claude 4 正式發佈 Opus 4 力壓 Gemini 2.5 Pro

流動日報

Claude Opus 4 力壓 Gemini 2.5 Pro 及 o3

Claude 玩 Pokémon

支援延伸思考與記憶

Claude Code 正式上線

API 新功能登場

留言 0

最新內容

Apple HomeOS 與相關硬體有望於 2026 年 WWDC 前亮相

政要、名流打卡點贊！廣汽攜全系新能源豪華陣容閃耀香港車博會

OpenAI、Anthropic、Google 頂尖模型隨你用 Lovable 周末限時免費任試

請更新您的瀏覽器

Claude 4 正式發佈　Opus 4 力壓 Gemini 2.5 Pro

OpenAI、Anthropic、Google 頂尖模型隨你用　Lovable 周末限時免費任試