Google เปิดตัว Nano Banana ยกระดับการแก้ไขภาพด้วย AI อวสาน Photoshop ?
Google เปิดตัวโมเดล Nano Banana การอัปเกรดใหม่ให้กับแชทบอท Gemini ภายใต้ชื่อ Gemini 2.5 Flash Image ซึ่งช่วยให้ผู้ใช้แก้ไขภาพได้อย่างแม่นยำและควบคุมรายละเอียดได้ดียิ่งขึ้น
ถือเป็นก้าวสำคัญในการไล่ตามความนิยมของเครื่องมือภาพจาก OpenAI และเพิ่มศักยภาพในการดึงดูดผู้ใช้จาก ChatGPT นอกจากนี้ความสามารถที่โดดเด่นจนทำให้ใครหลายคนคิดว่าอาจเป็นอวสานของการตัดต่อรูปภาพบน Photoshop
โมเดลภาพใน Gemini 2.5 Flash AI
Google เริ่มเปิดให้ใช้งานทั้งบนแอป Gemini รวมถึงแพลตฟอร์มสำหรับนักพัฒนาอย่าง Gemini API, Google AI Studio และ Vertex AI โดยโมเดลภาพใหม่นี้สามารถทำงานตามคำสั่งภาษาธรรมชาติได้อย่างสมจริง ไม่เพี้ยนใบหน้าหรือพื้นหลังเหมือนคู่แข่ง ตัวอย่างเช่น การเปลี่ยนสีเสื้อในภาพถ่ายโดยไม่กระทบองค์ประกอบอื่น
ความสามารถดังกล่าวถูกทดสอบบนแพลตฟอร์ม LMArena ภายใต้นามแฝง หรือ ชื่อเล่นว่า “Nano Banana” ก่อน Google จะยืนยันภายหลังว่าแท้จริงแล้ว คือ รุ่นย่อยของโมเดล Gemini 2.5 Flash AI ซึ่งทำผลงานได้โดดเด่นเหนือคู่แข่งหลายราย ทั้งในการประเมินฝีมือบน LMArena และการทดสอบมาตรฐานอื่น ๆ
นิโคล บริชโทวา (Nicole Brishtova) หัวหน้าผลิตภัณฑ์โมเดลสร้างภาพจาก Google DeepMind กล่าวกับเว็บไซต์ TechCrunch สื่อเทคโนโลยีชั้นนำว่า “เรากำลังผลักดันคุณภาพภาพและความสามารถในการทำตามคำสั่งไปอีกขั้น ทำให้การแก้ไขลื่นไหลขึ้น และโมเดลก็สามารถสร้างผลลัพธ์ที่ใช้ได้จริงตามต้องการ”
การแข่งขันในตลาด AI แต่งภาพ
การแข่งขันในตลาด AI ด้านภาพทวีความดุเดือดมากขึ้น หลังจาก OpenAI เปิดตัวเครื่องมือสร้างภาพใน GPT-4o เมื่อเดือนมีนาคมที่ทำให้ยอดใช้งาน ChatGPT พุ่งสูงจากกระแสมีมสตูดิโอจิบลิ ขณะที่ Meta เพิ่งประกาศว่าจะเปิดให้ใช้งานโมเดลภาพจาก Midjourney และ Black Forest Labs จากเยอรมนี ยังคงครองจุดแข็งด้วยโมเดล FLUX
แม้ Gemini จะยังมีจำนวนผู้ใช้น้อยกว่า โดย Google เปิดเผยว่ามีผู้ใช้งานประจำเดือน 450 ล้านคน น้อยกว่า ChatGPT ที่มีผู้ใช้ประจำสัปดาห์เกิน 700 ล้านคน แต่เครื่องมือแก้ไขภาพใหม่นี้อาจช่วยให้ Google ลดช่องว่างได้
Nano Banana เน้นใช้งานจริง
Google ระบุว่าโมเดลภาพใหม่นี้ถูกออกแบบมาสำหรับการใช้งานจริงของผู้บริโภค เช่น การช่วยเรนเดอร์โครงการบ้านและสวน รวมหลายองค์ประกอบเข้าด้วยกัน และยังเสริมด้วยความรู้เกี่ยวกับโลกเพื่อตอบสนองคำสั่งที่ซับซ้อนมากขึ้น
อย่างไรก็ตาม บริษัทเน้นว่ามีมาตรการป้องกันเพื่อจำกัดการใช้งานที่ไม่เหมาะสม เช่น การห้ามสร้าง “ภาพส่วนบุคคลที่ไม่ได้รับความยินยอม” และมีการใส่ลายน้ำและตัวระบุในเมตาดาต้าเพื่อรับมือกับปัญหา ดีปเฟก ที่แพร่หลายบนโซเชียลมีเดีย
ข่าวที่เกี่ยวข้อง