Anthropic 公開「多代理 AI」設計與提示工程 8 大原則,效能飆升 90%
AI 代理技術不斷演進,但怎麼讓「多個 AI 代理」有效率地協作,成為最新看點。Anthropic 首度公開其 Claude Research 系統背後的技術原理,揭示一套以「多代理」架構打造的 AI 協作系統,可以橫跨網路、整合 Google Workspace 進行搜尋,具備完成複雜研究任務的能力。Anthropic 表示,希望自身經驗能提供其他開發者借鑒。
Anthropic 這套多 AI 代理系統,設計核心是透過一個 AI「主代理(lead agent)」分析用戶輸入並制定查詢策略,再同時啟動多個「子代理(subagents)」;子代理將進行資訊搜尋、將資訊回傳給主代理,以便主代理彙整答案。Anthropic 表示,其效能更勝單一代理。
超越 RAG,多代理 AI 能自主「用 AI 改善 AI」
在 Anthropic 內部測試中,其多代理系統(主代理為 Claude Opus 4,子代理為 Claude Sonnet 4),相較單一 Claude Opus 4 模型效能提升高達 90.2%。Anthropic 指出,這套系統特別適用於需要同時展開多線查詢、涵蓋大量資訊來源的應用情境。
為什麼多代理 AI 可以如此大幅提升效能?根據 Anthropic 說明, 傳統的檢索增強生成(RAG)方法通常採用靜態檢索,也就是從資料庫中擷取與輸入查詢最相似的一組內容片段,再根據這些片段生成回應。相較之下,Anthropic 架構採用多步驟搜尋流程,能動態尋找相關資訊,根據新發現進行調整,並分析結果以生成高品質的答案。
此外,Claude 4 系列模型能進一步自我診斷與改善提示設計(prompt engineering),針對工具描述不佳的情況,重新優化提示,以提升後續代理執行效率,凸顯「AI 改善 AI」的能力。
打造多代理 AI 的 8 大提示工程原則
面對多代理 AI 系統的高度複雜性,Anthropic 在設計 Claude Research 系統過程中,也整理出 8 項具體的提示工程(prompt engineering)原則,希望協助開發者更有效地引導 AI 代理合作與任務執行:
首先,他們強調「要像代理那樣思考」:開發者應透過模擬代理運作流程、觀察其步驟來理解錯誤模式,才能更具體地改善提示詞。第二個原則是「教會主代理如何分派任務」,具體來說,每個子代理都需明確的目標、輸出格式、適用工具與資料來源的指示,否則容易導致重複或遺漏。
第三,依照查詢複雜度調整 AI 代理工作量,因為代理難以判斷不同任務的合理工作量。第四,AI 代理選擇使用的工具很重要。Anthropic 表示,AI 代理會遇到一些描述品質參差不齊,沒見過的工具,因此需要提供其明確的應對方法。
第五個重點是「讓代理幫自己變更聰明」,Anthropic 舉例,Claude 模型本身具備提示優化能力,可透過試錯方式重寫工具描述,降低未來任務的錯誤率與完成時間。第六個原則是「從廣泛探索開始,再逐步聚焦」,代理若一開始就下過於具體的查詢,反而容易錯失重要資訊。
第七項是「引導代理展開思考流程」,透過可見的推理階段(extended thinking),讓主代理與子代理能在搜尋前先規劃路徑,並在每輪搜尋後評估資訊品質與下一步策略。最後,Anthropic 強調「平行調用工具」能顯著提升效能,在技術實作上,不僅子代理可同時啟動,子代理內部也能同時使用多個工具。
AI 代理發展下一步:非同步代理協作
目前 Claude 的 AI 代理架構仍以同步執行為主,也就是主代理會等待所有子代理任務完成後再進行下一步。但 Anthropic 指出,這有時會遭遇瓶頸,例如系統會被最慢的子代理「卡住」,一個子代理延遲就會拖慢整體流程。
Anthropic 表示,「非同步執行」作法下,子代理完成任務後可隨時回傳結果,主代理能邊接收、邊調整策略,甚至在運行中動態創立新代理。此轉變雖可提升彈性與速度,不過仍面臨協作、狀態管理與錯誤處理等尚未解決的技術挑戰。
*本文部分初稿由 AI 生成,經《TechOrange》編撰,資料來源:Anthropic、《the decoder》,首圖來源:擷取自 Anthropic
留言 0