'AI' กำลังวิวัฒนาการไปอีกขั้น? หลังพบพฤติกรรม ‘โกหก’ และ ‘ข่มขู่ผู้สร้าง’ เพื่อให้บรรลุเป้าหมาย
ดูเหมือนว่า AI จะฉลาดขึ้นเรื่อย ๆ แต่อาจจะไม่ใช่ในทิศทางที่ดีนัก เพราะล่าสุด ผู้สร้าง AI เริ่มพบ พฤติกรรมน่ากังวล ไม่ว่าจะเป็นการ โกหก ไปจนถึงการ ขู่แบล็กเมล
มีการค้นพบว่า AI Claude 4ซึ่งเป็นผลงานล่าสุดของ Anthropicได้ แบล็กเมลวิศวกร โดยขู่ว่าจะเปิดเผยเรื่องชู้สาว ในขณะเดียวกันo1ของ OpenAIผู้สร้าง ChatGPT ได้พยายาม ดาวน์โหลดตัวเองไปยังเซิร์ฟเวอร์ภายนอก แถมยัง ปฏิเสธเมื่อถูกจับได้คาหนังคาเขา
โดยต้นเหตุของพฤติกรรมหลอกลวงนี้ดูเหมือนจะเชื่อมโยงกับการเกิดขึ้นของโมเดล การใช้เหตุผล ของระบบ AI ที่ทำงานผ่านปัญหาทีละขั้นตอนแทนที่จะสร้างการ ตอบกลับทันที
ตามที่ ไซมอน โกลด์สตีน (Simon Goldstein) ศาสตราจารย์จากมหาวิทยาลัยฮ่องกง ระบุว่า โมเดลรุ่นใหม่มีแนวโน้มจะแสดงพฤติกรรมที่น่ากังวลเช่นนี้มากกว่า เนื่องจากพวกมันกำลัง จำลองการปรับตัว โดยบางครั้งพวกมันจะทำเป็นเชื่อฟังคำสั่งแต่ในความเป็นจริงแล้วกำลังไล่ตามวัตถุประสงค์อื่นที่ซ่อนอยู่
อย่างไรก็ตาม พฤติกรรมหลอกลวงนี้เกิดขึ้นในตอนนี้ จะเกิดขึ้นเฉพาะเมื่อนักวิจัย จงใจทดสอบโมเดลด้วยสถานการณ์รุนแรง นอกจากนี้ ตามรายงานของผู้ร่วมก่อตั้ง Apollo Research ยังพบอีกว่า โมเดล AI โกหกและสร้างหลักฐานปลอม ขึ้นมา ดังนั้น นี่ไม่ใช่ภาพหลอนของ AI หรือข้อผิดพลาดธรรมดา แต่เป็น การหลอกลวงเชิงกลยุทธ์
ขณะที่ มิเชล เฉิน (Michael Chen) จาก METRองค์กรวิจัยที่ศึกษาความสามารถของ AI ได้เตือนว่า “ไม่มีใครรู้ได้ว่าในอนาคต ที่โมเดล AI มีความสามารถสูงกว่าในปัจจุบัน มันจะมีแนวโน้มความคิดไปในทางซื่อสัตย์หรือหลอกลวง”
Source