AI痛擊白領工作!Anthropic推出旗艦模型Opus 4.6、Cowork法律外掛,吃下財會、法務工作流
重點一:Anthropic 推出新一代旗艦模型 Claude Opus 4.6,在代理式程式開發、長上下文推理與網頁搜尋等關鍵評測中全面領先,成為新一代頂尖「智能體」大模型。
重點二 :Opus 4.6 大幅提升在網路安全、財經法律、長文本檢索等專業場景的實戰能力,並首度將 Opus 等級模型的上下文視窗推升至 100 萬 token。
重點三 :Anthropic 持續把 Claude 帶進實際工作流程,從法律外掛擴展到財務會計,並結合 Claude in Excel、PowerPoint 等辦公整合,吃下法律、會計等高附加價值知識工作。
美國 AI 新創 Anthropic 宣布推出最新旗艦大語言模型 Claude Opus 4.6,主打在「代理式程式開發」、長上下文推理與網路搜尋等實務評測全面超越同業,並首次為 Opus 等級模型開放 100 萬 token 上下文視窗。
官方強調,在強化推理與工具操作能力的同時,Opus 4.6 仍維持與前一代相當甚至略優的安全與對齊表現,且 API 價格仍為每百萬 token 5 美元(約合新台幣 158 元),試圖在效能、成本與風險控制之間取得新平衡。
Opus 4.6 的 AI 代理性能更強了
Anthropic 此輪更新,核心不再只是傳統基準測試分數,而是直指「真實工作流」:讓模型能在複雜、多步驟情境中,主動規劃、分解任務並呼叫工具完成工作。
在程式開發領域,Opus 4.6 在代理式程式評測 Terminal-Bench 2.0 上取得領先成績,並在長程多工具搜尋測試 BrowseComp 中拿下最高分。Anthropic 指出,該模型能在大型程式庫中長時間維持穩定的理解與規劃能力,包含自動閱讀、重構與除錯,並能在沒有過多人工「手把手」指示的情況下,自主完成系統性改動。
值得注意的是,Opus 4.6 不只在程式開發上展現「代理中樞」角色,在財經與法律等知識工作評測 GDPval-AA 上,也以約 144 Elo 分的差距領先 OpenAI 的 GPT-5.2,並較自家前一代 Opus 4.5 提升約 190 分,顯示其在實際商業決策與專業文書處理上的能力被大幅拉升。
支援 100 萬 token 上下文,有感延長工作流程
Opus 4.6 另一個關鍵,是在長上下文處理與任務持續性上的質變。Anthropic 首度為 Opus 等級模型開放 100 萬 token 上下文視窗(beta),並搭配「上下文壓縮」(context compaction)機制:當對話或任務接近預設上限時,模型會自動將較舊內容摘要重寫,以釋出空間、延長工作流程,而不必完全依賴外部工程實作。
在長文本檢索評測 MRCR v2(「針堆尋針」類型測試)中,Opus 4.6 在 100 萬 token 場景下的 8-needle 測試取得 76% 成績,遠高於 Sonnet 4.5 的 18.5%。
Anthropic 認為,這不只是「看得更多」,而是「在極長文本下仍能維持接近巔峰的推理品質」,從而支撐新的產品設計。例如,在 Claude Code 中啟用多代理「agent teams」,讓多個子代理分工並行處理複雜代碼審查與分析。
為了在效能與成本之間取得平衡,Anthropic 也在 API 端導入「自適應推理」(adaptive thinking)與 Effort 參數,開發者可以在低、中、高、最大四個 Effort 等級中調整。預設為「高」,模型會依任務難度自動決定是否啟動較長推理鏈;若用戶認為模型在簡單任務上「想太久」,則可下調 Effort 以減少延遲與費用。
在輸出能力方面,Opus 4.6 支援最多 128k token 的單次輸出,對於產生長篇報告、技術文件或大型程式補丁尤為重要。對需要遵循地區合規的企業客戶,Anthropic 也提供「僅在美國推論」選項,採 1.1 倍價格計費,鎖定對資料駐留與主權有嚴格要求的金融與政府客戶。
Claude 外掛上線!跨進「法律、會計」工作流
Anthropic 先前在 Claude Cowork 中針對法律場景推出外掛,能協助使用者追蹤合規流程、審閱與分類合約與保密協議 (NDA),並協助整理法律簡報與標記潛在風險。這批外掛的意義在於讓 AI 不只是回答問題,而是替企業承接一部分原本由初階律師或法務人員執行的重複性任務。
Anthropic 並未在更新當下大張旗鼓行銷,更新本身在科技圈外的聲量有限。但在法律產業與資本市場眼中,這代表 Claude 正由「模型供應商」走向「應用與工作流程層」,直接與既有法律科技服務正面交鋒。對高度仰賴訂閱收入與專業內容加值的傳統業者來說,一旦客戶相信通用型 AI 也能完成相近工作,原本建立在資料庫與品牌上的溢價,恐怕將被快速壓縮。
依據《商業內幕》報導,Anthropic 法律外掛推出後的週二交易日,與法律產業關聯度最高的數家軟體與資訊服務公司股價大幅下跌:Wolters Kluwer 股價單日下跌約 13%;英國資訊與數據服務集團 RELX 下跌約 15%;面向消費者提供線上法律服務的 LegalZoom 重挫 18%;在法律資訊與出版領域具指標性的湯森路透 (Thomson Reuters) 則暴跌 19%。這些公司今年以來股價原本就呈現緩步走低,Anthropic 更新發布後,跌勢明顯加速,年初至今跌幅已至少超過兩成。
而這次 Opus 4.6 更新,同步推出面向財務團隊的金融資訊外掛,定位為「月結與內控流程專用助手」。它能協助處理結帳、分錄、對帳、報表與差異分析等工作,把原本從月結到 SOX 稽核的一連串流程,自動化到先由 AI 產出 7~8 成初稿,再交由專業會計審閱與定稿。
Claude in PowerPoint 來了!
在產品層面,Anthropic 亦強化與辦公軟體的整合,包括升級 Claude in Excel 的長任務與多步驟資料處理能力,並推出 Claude in PowerPoint 的研究預覽版,能讀取版面配置、字型與母片設定,自動產出符合企業識別的簡報。
根據官方說明,「Claude in PowerPoint」的核心差異之一,是不只單純在投影片上「貼文字」,而是會先讀取簡報檔中的版面配置(layouts)、字型、顏色與 Slide Master 設定。換言之,當使用者開啟一份公司制式模板或客戶提供的簡報樣式時,Claude 會先理解這套模板如何定義標題頁、章節頁、內容頁等不同版型,並遵循既定的品牌色彩與字型規範。
在操作層面,使用者可以在載入模板後,以自然語言下指令,例如:「為這份簡報新增一個市場規模分析章節,包含 TAM、SAM、SOM 三張投影片。」Claude 會依照母片中既有的標題與內容版型生成新頁面,而非自行創造不相容的設計元素。
官方強調,這樣的運作方式能避免 AI 產出「風格走鐘」的投影片,讓企業不必擔心品牌手冊遭到破壞,也減少設計人員後續「收拾善後」的負擔。
延伸閱讀:Claude Code 10組完整提示詞!教你如何自動整理檔案、分析帳單⋯零技術新手也OK
本文初稿為AI編撰,整理.編輯/ 李先泰
延伸閱讀
蘋果發布Xcode 26.3!內建「Claude+Codex」AI代理神助手,一條龍包辦寫碼到測試
不用狂切分頁!Claude把Slack、Canva、Figma⋯都搬進聊天室,AI將正式接管日常工作流?
「加入《數位時代》LINE好友,科技新聞不漏接」