請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

Anthropic 公開「多代理 AI」設計與提示工程 8 大原則,效能飆升 90%

TechOrange 科技報橘

更新於 06月16日13:05 • 發布於 06月16日04:53 • 廖紹伶

AI 代理技術不斷演進,但怎麼讓「多個 AI 代理」有效率地協作,成為最新看點。Anthropic 首度公開其 Claude Research 系統背後的技術原理,揭示一套以「多代理」架構打造的 AI 協作系統,可以橫跨網路、整合 Google Workspace 進行搜尋,具備完成複雜研究任務的能力。Anthropic 表示,希望自身經驗能提供其他開發者借鑒。

Anthropic 這套多 AI 代理系統,設計核心是透過一個 AI「主代理(lead agent)」分析用戶輸入並制定查詢策略,再同時啟動多個「子代理(subagents)」;子代理將進行資訊搜尋、將資訊回傳給主代理,以便主代理彙整答案。Anthropic 表示,其效能更勝單一代理。

超越 RAG,多代理 AI 能自主「用 AI 改善 AI」

在 Anthropic 內部測試中,其多代理系統(主代理為 Claude Opus 4,子代理為 Claude Sonnet 4),相較單一 Claude Opus 4 模型效能提升高達 90.2%。Anthropic 指出,這套系統特別適用於需要同時展開多線查詢、涵蓋大量資訊來源的應用情境。

為什麼多代理 AI 可以如此大幅提升效能?根據 Anthropic 說明, 傳統的檢索增強生成(RAG)方法通常採用靜態檢索,也就是從資料庫中擷取與輸入查詢最相似的一組內容片段,再根據這些片段生成回應。相較之下,Anthropic 架構採用多步驟搜尋流程,能動態尋找相關資訊,根據新發現進行調整,並分析結果以生成高品質的答案

此外,Claude 4 系列模型能進一步自我診斷與改善提示設計(prompt engineering),針對工具描述不佳的情況,重新優化提示,以提升後續代理執行效率,凸顯「AI 改善 AI」的能力。

打造多代理 AI 的 8 大提示工程原則

面對多代理 AI 系統的高度複雜性,Anthropic 在設計 Claude Research 系統過程中,也整理出 8 項具體的提示工程(prompt engineering)原則,希望協助開發者更有效地引導 AI 代理合作與任務執行:

首先,他們強調「要像代理那樣思考」:開發者應透過模擬代理運作流程、觀察其步驟來理解錯誤模式,才能更具體地改善提示詞。第二個原則是「教會主代理如何分派任務」,具體來說,每個子代理都需明確的目標、輸出格式、適用工具與資料來源的指示,否則容易導致重複或遺漏。

第三,依照查詢複雜度調整 AI 代理工作量,因為代理難以判斷不同任務的合理工作量。第四,AI 代理選擇使用的工具很重要。Anthropic 表示,AI 代理會遇到一些描述品質參差不齊,沒見過的工具,因此需要提供其明確的應對方法。

第五個重點是「讓代理幫自己變更聰明」,Anthropic 舉例,Claude 模型本身具備提示優化能力,可透過試錯方式重寫工具描述,降低未來任務的錯誤率與完成時間。第六個原則是「從廣泛探索開始,再逐步聚焦」,代理若一開始就下過於具體的查詢,反而容易錯失重要資訊。

第七項是「引導代理展開思考流程」,透過可見的推理階段(extended thinking),讓主代理與子代理能在搜尋前先規劃路徑,並在每輪搜尋後評估資訊品質與下一步策略。最後,Anthropic 強調「平行調用工具能顯著提升效能,在技術實作上,不僅子代理可同時啟動,子代理內部也能同時使用多個工具。

AI 代理發展下一步:非同步代理協作

目前 Claude 的 AI 代理架構仍以同步執行為主,也就是主代理會等待所有子代理任務完成後再進行下一步。但 Anthropic 指出,這有時會遭遇瓶頸,例如系統會被最慢的子代理「卡住」,一個子代理延遲就會拖慢整體流程。

Anthropic 表示,「非同步執行」作法下,子代理完成任務後可隨時回傳結果,主代理能邊接收、邊調整策略,甚至在運行中動態創立新代理。此轉變雖可提升彈性與速度,不過仍面臨協作、狀態管理與錯誤處理等尚未解決的技術挑戰。

*本文部分初稿由 AI 生成,經《TechOrange》編撰,資料來源:Anthropic《the decoder》,首圖來源:擷取自 Anthropic

加入『 TechOrange 官方 LINE 好友』 掌握最新科技資訊!

查看原始文章

更多理財相關文章

01

景氣燈號「回落近1年半」最低點 國發會點3因素恐添變數

TVBS
02

台積電沒拿到特斯拉165億美元大單!馬斯克把最新晶片交給「這企業」製造

風傳媒
03

金管會ETF新規 專家:高股息要掰了?

NOWnews 今日新聞
04

台灣無人機出口暴增近7.5倍! 不是烏克蘭 「這國」是最大買家.....

新頭殼
05

士電、中興電、亞力、華城...台美加速電網投資,重電4雄誰能領風騷?

商周財富網
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
查看更多

留言 0

沒有留言。

最新消息

智易(3596)啟動成長週期,寬頻與5G需求推升未來兩年營運動能

優分析

美歐貿易協定達成「美股漲跌互見」 台指期盤後小跌68點

民視新聞網

川普設俄烏停火新期限引供應擔憂 國際油價走揚

中央通訊社

蔡明忠組團破局/難擋剪線潮雪崩另謀出路 蔡明忠組寬頻聯軍抗中華電信失利

鏡週刊

蔡明忠組團破局1/蔡明忠登高一呼被打槍 揭密寬頻業者冷回應4大理由

鏡週刊

蔡明忠組團破局2/全台有線電視業者山頭林立 他讓蔡明忠再踢鐵板

鏡週刊

蔡明忠組團破局3/寬頻一哥中華電信沒在怕 不打價格戰直攻加值應用

鏡週刊

陸行之直指五大因素使得三星拿到特斯拉晶片代工生意

科技新報

金融時報:特斯拉165億美元大單 仍難挽回三星晶圓代工頹勢 Edit

anue鉅亨網

鉅亨速報 - Factset 最新調查:RPM International, Inc.RPM-US的目標價調升至135元,幅度約7.14%

anue鉅亨網

鉅亨速報 - Factset 最新調查:Credo Technology Group Holding LtdCRDO-US的目標價調升至112元,幅度約8.21%

anue鉅亨網

盤中速報 - 哈希圖大跌8.47%,報0.2668美元

anue鉅亨網

下半年信用卡權益變動(二) 3張LINE Pay大決鬥

卡優新聞網

台新新光壽險通過合併 雙證券整併躍升第4大

卡優新聞網

房市冷淡買舊不買新 北市老屋交易成主流

卡優新聞網

億級高資產戶破萬人 玉山銀挺進財管3強

卡優新聞網

盤中速報 - Sui大跌8.17%,報4美元

anue鉅亨網

日本淡化川普貿易協議風險 稱5500億投資多為放貸

anue鉅亨網

藥價要漲了?歐美貿易協議15%關稅 製藥業成本恐增至190億美元

anue鉅亨網

盤中速報 - CRV大跌8.58%,報0.974美元

anue鉅亨網

鉅亨速報 - Factset 最新調查:Range資源-路易斯安那(RRC-US)EPS預估下修至3.12元,預估目標價為44.00元

anue鉅亨網

鉅亨速報 - Factset 最新調查:Expand Energy Corporation(EXE-US)EPS預估下修至6.78元,預估目標價為134.50元

anue鉅亨網

鉅亨速報 - Factset 最新調查:Woori Financial Group Inc - ADR(WF-US)EPS預估上修至8.88元,預估目標價為57.49元

anue鉅亨網

鉅亨速報 - Factset 最新調查:Antero Resources Corp(AR-US)EPS預估下修至2.59元,預估目標價為46.00元

anue鉅亨網

鉅亨速報 - Factset 最新調查:雪佛龍(CVX-US)EPS預估上修至7.8元,預估目標價為165.00元

anue鉅亨網

鉅亨速報 - Factset 最新調查:加拿大自然資源公司(CNQ-US)EPS預估上修至2.55元,預估目標價為37.97元

anue鉅亨網

鉅亨速報 - Factset 最新調查:SharkNinja Inc.SN-US的目標價調升至126元,幅度約4.13%

anue鉅亨網

鉅亨速報 - Factset 最新調查:布魯姆能源BE-US的目標價調升至28.5元,幅度約5.56%

anue鉅亨網

微軟Edge新推「Copilot模式」 AI助理深化網頁瀏覽體驗

anue鉅亨網

鋰價反彈疑似曇花一現,鋰概念股Albemarle股價暴跌逾10% 投資人獲利了結

優分析

挑戰 OpenAI,傳「中國 AI 六小虎」智譜擬釋史上最大開源模型

科技新報

外匯速報 - 紐元/美元(NZDUSD) 大跌0.78%,報0.5967元

anue鉅亨網

四大藥品 2028 年前上市銷售!友霖生技預計 8 月底掛牌上櫃

科技新報

焦點速報 - 美元指數(DXY) 大漲0.95%,報98.57點

anue鉅亨網

擔心影響注意力,YouTube 聯合創辦人也不希望孩子沉迷短影音

科技新報

因應上汽集團全球品牌戰略佈局,MAXUS G50 Plus 延遲一年改以 MG 品牌於 8/20 在台販售!

CarStuff人車事

美歐貿易協議使市場不安 歐股收盤挫跌

中央通訊社

泰柬停火後美國貿易談判重啟 泰國盼獲「好協議」

anue鉅亨網

Honda 純電輕型車第二彈:「N-ONE e:」先導網站上線,預計今秋先行於日本上市!

CarStuff人車事

鉅亨速報 - Factset 最新調查:Roku公司(ROKU-US)EPS預估上修至-0.19元,預估目標價為100.00元

anue鉅亨網