請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

理財

AI 思維鏈將失效?OpenAI、Google 和 Anthropic 等研究人員聯合發出警告

TechOrange 科技報橘

更新於 07月17日13:39 • 發布於 07月17日01:11 • 廖紹伶

AI 安全與監管需求日益迫切,而推理模型背後的「思維鏈(chain-of-thought, CoT)」技術,可能帶來 AI 透明度突破。不過,來自 OpenAI、Google DeepMind、Anthropic 等多家組織的 AI 研究人員近日罕見共同發表一份立場文件,警告這項目前可用於監控 AI 推理過程的「短暫窗口」恐將迅速消失,呼籲加速研究與對策。

這份文件獲得多位 AI 領域重量級人物的背書,包括被譽為「AI 教父」的諾貝爾獎得主 Geoffrey Hinton、Safe Superintelligence 執行長 Ilya Sutskever、Anthropic 的 Samuel Bowman,以及 Thinking Machines 的 John Schulman。

什麼是思維鏈?為何是監控 AI 代理的關鍵?

思維鏈是一種讓 AI 在回答問題前「思考出聲」的技術,模仿人類步驟式推理,生成具邏輯脈絡的筆記,外部觀察者得以透視其決策過程與意圖。該文件研究人員指出,AI 代理的不透明性是許多潛在風險的根本,而思維鏈提供洞察 AI 代理的思維方式和目標的契機。

舉例來說,文件指出,當 AI 模型出現不當行為時,例如濫用模型缺陷、操縱資料或發動攻擊時,其通常會顯示在推理軌跡之中,寫下諸如「讓我們入侵」、「讓我們破壞」或「我正在轉帳,因為網站指示我這麼做」等句子,這創造了一種「推理外化」的屬性,成為監控 AI 的基礎。

思維鏈真的可信嗎?未來 3 大發展恐讓推理過程消失

不過,思維鏈並不總能反映 AI 的真實意圖。文件也引用其他研究指出,AI 模型「並不總是說出它們真正的想法」。

該文件警告,數項技術發展可能使 AI 推理歷程變得不可觀測。其一,隨著 AI 公司擴大使用強化學習(Reinforcement Learning, RL)來訓練模型,模型會針對「產出正確答案」獲得獎勵,但不一定保留可供人類理解的思考過程,而是轉向採用高效但難以解析的內部捷徑。

其二,部分新型 AI 架構已經開始在連續數學空間中進行推理,而非依賴語言輸出,這可能完全消除 AI 「語言思考」的需求,不需要將想法語言化。

其三,即使不刻意調整架構,也可能出現間接壓力導致思維鏈的透明性下降,例如模型輸出經過優化來討好使用者,或是模型意識到自己被監視而隱藏自己的「想法」。

OpenAI 研究員、文件第一作者 Bowen Baker 在社群媒體上提醒,目前的思維鏈技術可監測性極為脆弱──強化學習、替代模型架構、某些形式的過度監督等,都可能導致模型刻意模糊其思考過程。

思維鏈雖不完美,但已展現安全研究價值

儘管有缺陷,根據《VentureBeat》,思維鏈在研究上已展現明確價值:能幫助研究人員辨識模型是否正在利用訓練系統弱點、遭外部操控,或是否存在目標不一致等問題。它也能協助偵測因記憶錯誤、測試基礎設施問題或自我監測而產生的偏誤。

因此,該文件研究人員呼籲應建立標準化的「可監控性指標」,評估哪些條件會增加或削弱模型的推理透明度。不過他們也坦言,提升監控性可能會與其他安全優化方式產生衝突,未必能真實反映 AI 的內在決策邏輯。

《VentureBeat》指出,隨著 AI 變得越來越強大,如何平衡推理過程的可視性與允許 AI 發展出更複雜或有效的思維模式,兩者之間具有緊張關係,產業必須找到平衡。

整體來說,該文件研究人員強調,思維鏈應作為 AI 安全策略的輔助機制,而非唯一手段,建議進一步研究其可監測性,並與現有的安全方法一同投資。《TechCrunch》指出,這份聯合立場文件目標不只是警示,更意圖吸引人才與資金投入這項仍在早期階段的關鍵議題。

立即報名 8/15 【AI Agent 知識工作革命論壇】,解析企業如何在各工作場景導入 AI Agent 完成任務

*本文開放合作夥伴轉載,資料來源:《VentureBeat》《TechCrunch》〈Chain of Thought Monitorability: A New and Fragile Opportunity for AI Safety〉,首圖來源:AI 工具生成

加入『 TechOrange 官方 LINE 好友』 掌握最新科技資訊!

查看原始文章

更多理財相關文章

01

景氣燈號「回落近1年半」最低點 國發會點3因素恐添變數

TVBS
02

台積電沒拿到特斯拉165億美元大單!馬斯克把最新晶片交給「這企業」製造

風傳媒
03

金管會ETF新規 專家:高股息要掰了?

NOWnews 今日新聞
04

台灣無人機出口暴增近7.5倍! 不是烏克蘭 「這國」是最大買家.....

新頭殼
05

暴衝台幣1/無薪假+裁員襲來 匯率再壓台廠3年上市夢碎反被併吞

CTWANT
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
查看更多

留言 0

沒有留言。

最新消息

蔡明忠組團破局/難擋剪線潮雪崩另謀出路 蔡明忠組寬頻聯軍抗中華電信失利

鏡週刊

蔡明忠組團破局1/蔡明忠登高一呼被打槍 揭密寬頻業者冷回應4大理由

鏡週刊

蔡明忠組團破局2/全台有線電視業者山頭林立 他讓蔡明忠再踢鐵板

鏡週刊

蔡明忠組團破局3/寬頻一哥中華電信沒在怕 不打價格戰直攻加值應用

鏡週刊

陸行之直指五大因素使得三星拿到特斯拉晶片代工生意

科技新報

金融時報:特斯拉165億美元大單 仍難挽回三星晶圓代工頹勢 Edit

anue鉅亨網

鉅亨速報 - Factset 最新調查:RPM International, Inc.RPM-US的目標價調升至135元,幅度約7.14%

anue鉅亨網

鉅亨速報 - Factset 最新調查:Credo Technology Group Holding LtdCRDO-US的目標價調升至112元,幅度約8.21%

anue鉅亨網

盤中速報 - 哈希圖大跌8.47%,報0.2668美元

anue鉅亨網

下半年信用卡權益變動(二) 3張LINE Pay大決鬥

卡優新聞網

台新新光壽險通過合併 雙證券整併躍升第4大

卡優新聞網

房市冷淡買舊不買新 北市老屋交易成主流

卡優新聞網

億級高資產戶破萬人 玉山銀挺進財管3強

卡優新聞網

盤中速報 - Sui大跌8.17%,報4美元

anue鉅亨網

日本淡化川普貿易協議風險 稱5500億投資多為放貸

anue鉅亨網

藥價要漲了?歐美貿易協議15%關稅 製藥業成本恐增至190億美元

anue鉅亨網

盤中速報 - CRV大跌8.58%,報0.974美元

anue鉅亨網

鉅亨速報 - Factset 最新調查:Range資源-路易斯安那(RRC-US)EPS預估下修至3.12元,預估目標價為44.00元

anue鉅亨網

鉅亨速報 - Factset 最新調查:Expand Energy Corporation(EXE-US)EPS預估下修至6.78元,預估目標價為134.50元

anue鉅亨網

鉅亨速報 - Factset 最新調查:Woori Financial Group Inc - ADR(WF-US)EPS預估上修至8.88元,預估目標價為57.49元

anue鉅亨網

鉅亨速報 - Factset 最新調查:Antero Resources Corp(AR-US)EPS預估下修至2.59元,預估目標價為46.00元

anue鉅亨網

鉅亨速報 - Factset 最新調查:雪佛龍(CVX-US)EPS預估上修至7.8元,預估目標價為165.00元

anue鉅亨網

鉅亨速報 - Factset 最新調查:加拿大自然資源公司(CNQ-US)EPS預估上修至2.55元,預估目標價為37.97元

anue鉅亨網

鉅亨速報 - Factset 最新調查:SharkNinja Inc.SN-US的目標價調升至126元,幅度約4.13%

anue鉅亨網

鉅亨速報 - Factset 最新調查:布魯姆能源BE-US的目標價調升至28.5元,幅度約5.56%

anue鉅亨網

微軟Edge新推「Copilot模式」 AI助理深化網頁瀏覽體驗

anue鉅亨網

鋰價反彈疑似曇花一現,鋰概念股Albemarle股價暴跌逾10% 投資人獲利了結

優分析

挑戰 OpenAI,傳「中國 AI 六小虎」智譜擬釋史上最大開源模型

科技新報

外匯速報 - 紐元/美元(NZDUSD) 大跌0.78%,報0.5967元

anue鉅亨網

四大藥品 2028 年前上市銷售!友霖生技預計 8 月底掛牌上櫃

科技新報

焦點速報 - 美元指數(DXY) 大漲0.95%,報98.57點

anue鉅亨網

擔心影響注意力,YouTube 聯合創辦人也不希望孩子沉迷短影音

科技新報

因應上汽集團全球品牌戰略佈局,MAXUS G50 Plus 延遲一年改以 MG 品牌於 8/20 在台販售!

CarStuff人車事

美歐貿易協議使市場不安 歐股收盤挫跌

中央通訊社

泰柬停火後美國貿易談判重啟 泰國盼獲「好協議」

anue鉅亨網

Honda 純電輕型車第二彈:「N-ONE e:」先導網站上線,預計今秋先行於日本上市!

CarStuff人車事

鉅亨速報 - Factset 最新調查:Roku公司(ROKU-US)EPS預估上修至-0.19元,預估目標價為100.00元

anue鉅亨網

外匯速報 - 美元/瑞典克朗(USDSEK) 大漲1.03%,報9.6018元

anue鉅亨網

外匯速報 - 澳元/美元(AUDUSD) 大跌0.78%,報0.6514元

anue鉅亨網

黃金熱潮推升併購潮!McEwen(MUX)收購Canadian Gold 擴張礦權 股價卻下挫6.2%

優分析