OpenAI 推出 ChatGPT Agent 能控制整台電腦！使用者體驗如何？

更新於 07月18日18:32 • 發布於 07月18日04:49 • 廖紹伶

「幫我看一下行事曆，並根據最近新聞整理會議重點」，或是「幫我分析三個競爭對手並製成簡報」，這些以往需人工操作的多步驟任務，如今都可交由 ChatGPT 協助完成了。OpenAI 宣布一款名為 ChatGPT Agent 的全新通用 AI 代理，可以代表使用者完成各種基於電腦的任務。

根據 OpenAI 說法，這款 AI 代理整合旗下多項 AI 代理工具功能，包括可模擬網站互動的 Operator，以及整合多網站資訊產出報告的 Deep Research。使用者僅需輸入自然語言指令，即可與新 AI 代理互動。該產品由專門開發的新模型提供支援。

《TechCrunch》指出，OpenAI、Google、Perplexity 等公司近來已經推出數十款 AI 代理，但過去版本多半難以應付複雜任務。而 OpenAI 這次似乎更有信心，表示新款 AI 代理比以前產品功能更強大。

ChatGPT Agent 可以做到什麼？

ChatGPT Agent 的產品負責人 Yash Kumar 和研究負責人 Isa Fulford 向《The Verge》等外媒展示多種應用情境，等外媒展示了多種應用場景，例如整合日曆與訂位平台自動安排約會，並可依使用者需求即時調整條件；也能生成具主題焦點的研究報告。

Fulford 表示，他很喜歡用 ChatGPT Agent 來進行線上購物，而 Kumar 則表示，他已經開始使用 ChatGPT Agent 來自動化生活中一些小任務，例如每週四自動申請 OpenAI 的辦公室停車位。

整體而言，ChatGPT Agent 可代為執行橫跨多個雲端應用的任務，並在涉及敏感資訊時主動請求授權。使用者可透過 ChatGPT 工具下拉選單啟用「Agent mode」，或直接輸入「/agent」指令啟動。OpenAI 表示，該功能已於週四向 Pro、Plus、Team 用戶開放，並將於今年夏天稍晚擴大支援 Enterprise 與 Education 用戶。

不過，OpenAI 執行長奧特曼在社群平台 X 提醒使用者謹慎授權，如協調多人晚宴時開放行事曆存取可能合理，但若僅需代購衣物則無需開放。這是因為，OpenAI 還不清楚這款 AI 代理具體會造成甚麼影響，但惡意行為者可能會試圖誘騙用戶的 AI 代理。因此，他個人還不會將 ChatGPT Agent 用於高風險用途或獲得大量個人資料。

使用者的 ChatGPT Agent 體驗如何？

外媒普遍指出，OpenAI 的示範中可見 ChatGPT Agent 執行速度略顯緩慢。對此，Kumar 表示他們更專注於優化高難度任務，用戶不應只是坐著看 ChatGPT Agent 的工作。他告訴《The Verge》，「即使需要 15分鐘或半小時，相比實際需要的時間，這也是一個相當大的加速，」而 OpenAI 搜尋團隊相對關注延遲性問題。

除了速度，ChatGPT Agent 工作任務的廣度和深度如何？關注 AI 發展的媒體《EVERY》已進行初步測試：他們想要了解自家電子郵件管理產品的客戶狀況，因此開啟了一個新的 ChatGPT 聊天，並啟用該功能。

他們請 ChatGPT Agent 閱讀客服信箱與論壇貼文，了解其郵件管理產品的用戶樣貌、好評與抱怨。而 15 分鐘內，ChatGPT Agent 就完成閱讀 1,300 封信件與大量貼文，並產出一份 2,000 字的摘要報告。

《EVERY》表示，ChatGPT Agent 找出所有喜歡其電子郵件管理產品的人，還在 LinkedIn 上搜尋這些用戶，建立了一組顧客典型輪廓。他們指出，這是 Deep Research 和 Operator 各自無法做到的事。

除了上述案例，《EVERY》還讓 ChatGPT Agent 執行多項任務，包括規劃寫作閉關地點、分析公司財報與營運數據並製作簡報、檢視旗下網站的使用者體驗，並每日整理 AI 領域最新動態，特別聚焦於 AI 與遊戲、對齊問題與合成資料等議題。

儘管 ChatGPT Agent 功能強大，但《EVERY》執行長 Dan Shipper 表示既有的 AI 工具如 o3 以物超所值，而 Claude Code 在寫程式與研究任務方面仍為其首選。他評論，OpenAI 雖持續將複雜技術融入消費者產品，但可能犧牲客製化和組合彈性。不過，他仍認為 ChatGPT Agent 帶來意想不到的價值，占有一席之地。