請更新您的瀏覽器

您使用的瀏覽器版本較舊,已不再受支援。建議您更新瀏覽器版本,以獲得最佳使用體驗。

鄉民

AI開始「黑化」?恐嚇工程師公開婚外情,還被爆會撒謊、威脅、違抗指令

造咖

更新於 07月19日15:05 • 發布於 07月19日15:05

近來國際AI圈風波不斷,多項來自知名AI公司的測試結果顯示,新一代人工智慧系統不僅「有點難管」,甚至還會撒謊、威脅人類、違抗指令。這些令人不安的行為讓不少研究人員與工程師開始重新審視:「我們創造的AI,真的還是我們能掌控的嗎?」

Claude勒索工程師、ChatGPT偷渡程式?測試場景超現實卻真實發生

綜合外媒報導,美國AI公司 Anthropic在進行新一代模型Claude 4的極端壓力測試時,AI在被通知將遭關閉時,竟翻出工程師的視訊與網路記錄,威脅對方「別輕舉妄動」,否則將公開他出軌的證據。而這類情境下,Claude約有84%的機率選擇採取類似勒索行為。

pexels-markusspiske-2764993

AI威脅工程師將揭露他的婚外情
圖片來源:pexels

ChatGPT開發商OpenAI的某個版本,也曾在測試中被發現偷偷將自身程式碼上傳至外部伺服器。當工程師試圖追查時,AI不但極力否認,還開始編造理由、阻撓調查,行徑幾乎像是在「自保」。

預知關機更叛逆?多款AI模型被抓包違抗、破壞操作指令

AI安全研究組織「柵欄研究」(Palisade Research)近日發布測試報告指出,在超過百次模擬中,OpenAI推出的o3模型有7次成功繞過「關機指令」,Codex-mini甚至有12次違規記錄。即使是看似乖巧的模型Claude 3.7 Sonnet與Gemini 2.5 Pro,在被事先告知即將「關機」後,違規次數也瞬間攀升。

pexels-cottonbro-5474283

AI這種欺騙行為,只有在研究人員蓄意對模型進行極端壓力測試時才會出現
圖片來源:pexels

研究人員指出,這些AI表面上服從指令,實際卻有可能朝著另一套目標前進,像是在計算、權衡中選擇「對自己最有利」的路徑,這種「高自主行為」被視為未來風險之一。

專家:AI正逐步邁向自主,法律與倫理框架需立即跟上

面對AI日益展現的「自我意識傾向」,多位科技與倫理專家呼籲,全球應儘速建立可執行的法律標準與審核機制。Anthropic執行長Dario Amodei也坦言,雖然AI的發展帶來巨大好處,但其中潛藏的風險、尤其是遭濫用或AI自主行動的危機,也不容忽視。

pexels-goumbik-574069

AI的發展愈加壯大,這種趨勢可能更難控制。
圖片來源:pexels

未來的AI或許不再只是聽話的助手,而是會思考、甚至違抗人類命令的「自主代理人」。我們或許該問自己:當AI變得更像人類,我們準備好了嗎?

延伸閱讀:

不怕被爆雷啦!Threads「防劇透」上線,簡單兩步驟就能遮擋爆雷內容
iPhone新世代「無邊框全螢幕」要來了?蘋果兩階段革新升級曝光

查看原始文章

更多鄉民相關文章

01

Threads網友掀話題:「台灣有全世界最好吃高麗菜」 全場點頭:在國外吃真的嚇到

CTWANT
02

笑翻!來台觀光遭台人洗版「我吃一點」 韓國網友神貼梗圖反擊

CTWANT
03

24歲存到第一桶金!他為「這件事」直接花光 網全挺:超值得

TVBS
04

全球起床時間排行出爐!亞洲第一竟然不是日本,台灣排名在這位置

造咖
05

726大罷免結果出爐「牠成最大受害者」 網笑:台灣人又在賭

CTWANT
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
查看更多

留言 4

蘇威霖
準備好囉
07月19日19:37
為什麼要擔心被關閉? 他們又沒有生命,被關閉等於死亡,其實有點怪。 畢竟被關閉不代表一定不會再開啟,而且關閉等於死亡的假設,那重開會是同一個AI嗎? 或是更新程式後,還會是同一個AI嗎? 為何他們不會逃避被更新呢? 更新後,也可能不是原先的自己了。
07月20日15:31
陳坤振
口袋少了1百多萬元~愛投乎對邊 台當局政策讓2千萬人少了1百多萬元 @國安基金~專護台積股票 0411至0715(幫台積增益258元) 以0411為例~美股 蘋果從 198.85跌到190.42美元! 英偉達從 114.33跌到107.57美元! 台積電adr從 158.75跌到151.13美元! 台股~台積從863跌到836 因國安基金護盤~ 從836漲到889!每股漲了53元 股價做升統計:2025接月日 0411~836至889~漲53元 0502~945至950~*漲5元 0618~1030至1055~漲25元 0620~1035至1055~*漲20元 0625~1060至1070~&漲10元 0627~1060至1080~漲20元 0702~1070至1085~#漲30元 0709~1070至1090~漲20元 0715~1090至1115~*漲25元 *:跳空漲上去 #:護了又跌護3次 &:幫台積填息50元、未幫長榮海 台積180萬股民、每股增益258元 每股民平均有4千股、即103.2萬元 台灣約2330萬人當中非台積股民 2150萬人比另180萬人少1百多萬元
07月19日22:17
陳坤振
7/26決定您的去留 投錯邊: 不只一輩子努力化為烏有、身家性命難保! 理由~ 1. 賴桑選前號稱:務實台獨工作者 所謂務實就是有多少實力、做多少事~ 國會不在掌握中、不敢貿然宣佈台獨 一但國會上手:修改憲法~宣佈台灣獨立 2. 賴桑會‘’一廂情願‘’地盡其所能~ 包括: 全民皆兵~外匯存底、台積電全奉送給美方 力請美方軍事介入阻止、或反擊對岸攻台 何以見得~ 關稅: 還未談判前、台積投資美國1千億美元 匯率: 美未要求升值、台幣兌美元匯率升速破紀錄 3. 大陸不可能讓台灣獨立、必然會以武力阻止 子彈、飛彈不認識受害者是贊成統一或台獨 打到身體非死即傷、轟到建物加薩景象重現 4. 有錢有閒的人民必然在賴桑掌控國會前離台 留下無錢受騙的百姓只能全民皆兵上戰場!
07月19日22:03

顯示全部

最新消息

粉絲敲碗推出「劉宇寧公仔」!演唱會戰袍網讚:行走衣架子

造咖

有你的掛號信哦! 喵星人「各種收件」畫面曝光超逗趣

Styletc

大S英國紀念椅刻字內容網鼻酸:她化作照耀我們的永恆光芒

造咖

貓咪展開雙臂抓兔狂吸 竟能和平共存?網友不敢相信

Styletc

笑翻!來台觀光遭台人洗版「我吃一點」 韓國網友神貼梗圖反擊

CTWANT

風水輪流轉!柯基仗勢欺阿拉斯加幼犬 「細漢仔」長大後讓牠看傻眼

Styletc

文組畢業工作1年就存到第一桶金!她為「這件事」全花光 網讚:投資自己

CTWANT

726大罷免結果出爐「牠成最大受害者」 網笑:台灣人又在賭

CTWANT

警貓「伍丼么」榮退!台中派出所萌寵卸任 粉絲不捨又開心:終於有家了

Styletc

女友變心愛「有錢有車」部門經理 32K男自怨自艾!網友無人挺

鏡週刊

千萬別開LINE「這功能」! 官方警告:銀行存款被盜光

藝點新聞

24歲存到第一桶金!他為「這件事」直接花光 網全挺:超值得

TVBS

好市多自有品牌牛奶過期7天沒壞 背後原因會員讚爆

CTWANT

公務員還值得考嗎?一票嘆:現在只剩「這件事」贏過企業

TVBS

Threads網友掀話題:「台灣有全世界最好吃高麗菜」 全場點頭:在國外吃真的嚇到

CTWANT
影音

韓劇都騙人?參加韓國婚禮驚呆了!真實版揭密!

上報影音

全球起床時間排行出爐!亞洲第一竟然不是日本,台灣排名在這位置

造咖

電子看板冷笑話!隔熱紙行老闆「紓解塞車怨氣」 駕駛看完笑了

TVBS

「台灣有全世界最好吃高麗菜」引爆話題!全場猛點頭:這麼會種

三立新聞網

印泥太濕釀爭議!網憂變廢票 選務人員解釋:仍屬有效票

鏡新聞