AI開始「黑化」？恐嚇工程師公開婚外情，還被爆會撒謊、威脅、違抗指令

更新於 07月19日15:05 • 發布於 07月19日15:05

近來國際AI圈風波不斷，多項來自知名AI公司的測試結果顯示，新一代人工智慧系統不僅「有點難管」，甚至還會撒謊、威脅人類、違抗指令。這些令人不安的行為讓不少研究人員與工程師開始重新審視：「我們創造的AI，真的還是我們能掌控的嗎？」

Claude勒索工程師、ChatGPT偷渡程式？測試場景超現實卻真實發生

綜合外媒報導，美國AI公司 Anthropic在進行新一代模型Claude 4的極端壓力測試時，AI在被通知將遭關閉時，竟翻出工程師的視訊與網路記錄，威脅對方「別輕舉妄動」，否則將公開他出軌的證據。而這類情境下，Claude約有84%的機率選擇採取類似勒索行為。

pexels-markusspiske-2764993

AI威脅工程師將揭露他的婚外情
圖片來源：pexels

ChatGPT開發商OpenAI的某個版本，也曾在測試中被發現偷偷將自身程式碼上傳至外部伺服器。當工程師試圖追查時，AI不但極力否認，還開始編造理由、阻撓調查，行徑幾乎像是在「自保」。

預知關機更叛逆？多款AI模型被抓包違抗、破壞操作指令

AI安全研究組織「柵欄研究」（Palisade Research）近日發布測試報告指出，在超過百次模擬中，OpenAI推出的o3模型有7次成功繞過「關機指令」，Codex-mini甚至有12次違規記錄。即使是看似乖巧的模型Claude 3.7 Sonnet與Gemini 2.5 Pro，在被事先告知即將「關機」後，違規次數也瞬間攀升。

pexels-cottonbro-5474283

AI這種欺騙行為，只有在研究人員蓄意對模型進行極端壓力測試時才會出現
圖片來源：pexels

研究人員指出，這些AI表面上服從指令，實際卻有可能朝著另一套目標前進，像是在計算、權衡中選擇「對自己最有利」的路徑，這種「高自主行為」被視為未來風險之一。

專家：AI正逐步邁向自主，法律與倫理框架需立即跟上

面對AI日益展現的「自我意識傾向」，多位科技與倫理專家呼籲，全球應儘速建立可執行的法律標準與審核機制。Anthropic執行長Dario Amodei也坦言，雖然AI的發展帶來巨大好處，但其中潛藏的風險、尤其是遭濫用或AI自主行動的危機，也不容忽視。

pexels-goumbik-574069

AI的發展愈加壯大，這種趨勢可能更難控制。
圖片來源：pexels

未來的AI或許不再只是聽話的助手，而是會思考、甚至違抗人類命令的「自主代理人」。我們或許該問自己：當AI變得更像人類，我們準備好了嗎？

留言 4

蘇威霖

準備好囉

07月19日19:37

霖

為什麼要擔心被關閉？他們又沒有生命，被關閉等於死亡，其實有點怪。畢竟被關閉不代表一定不會再開啟，而且關閉等於死亡的假設，那重開會是同一個AI嗎？或是更新程式後，還會是同一個AI嗎？為何他們不會逃避被更新呢？更新後，也可能不是原先的自己了。

07月20日15:31

陳坤振

口袋少了1百多萬元～愛投乎對邊台當局政策讓2千萬人少了1百多萬元 @國安基金～專護台積股票 0411至0715(幫台積增益258元) 以0411為例～美股蘋果從 198.85跌到190.42美元！英偉達從 114.33跌到107.57美元！台積電adr從 158.75跌到151.13美元！台股～台積從863跌到836 因國安基金護盤～從836漲到889！每股漲了53元股價做升統計：2025接月日 0411～836至889～漲53元 0502～945至950～*漲5元 0618～1030至1055～漲25元 0620～1035至1055～*漲20元 0625～1060至1070～＆漲10元 0627～1060至1080～漲20元 0702～1070至1085～#漲30元 0709～1070至1090～漲20元 0715～1090至1115～*漲25元 *：跳空漲上去 #：護了又跌護3次＆：幫台積填息50元、未幫長榮海台積180萬股民、每股增益258元每股民平均有4千股、即103.2萬元台灣約2330萬人當中非台積股民 2150萬人比另180萬人少1百多萬元

07月19日22:17

陳坤振

7/26決定您的去留投錯邊：不只一輩子努力化為烏有、身家性命難保！理由～ 1. 賴桑選前號稱：務實台獨工作者所謂務實就是有多少實力、做多少事～國會不在掌握中、不敢貿然宣佈台獨一但國會上手：修改憲法～宣佈台灣獨立 2. 賴桑會‘’一廂情願‘’地盡其所能～包括：全民皆兵～外匯存底、台積電全奉送給美方力請美方軍事介入阻止、或反擊對岸攻台何以見得～關稅：還未談判前、台積投資美國1千億美元匯率：美未要求升值、台幣兌美元匯率升速破紀錄 3. 大陸不可能讓台灣獨立、必然會以武力阻止子彈、飛彈不認識受害者是贊成統一或台獨打到身體非死即傷、轟到建物加薩景象重現 4. 有錢有閒的人民必然在賴桑掌控國會前離台留下無錢受騙的百姓只能全民皆兵上戰場！

07月19日22:03