โปรดอัพเดตเบราว์เซอร์

เบราว์เซอร์ที่คุณใช้เป็นเวอร์ชันเก่าซึ่งไม่สามารถใช้บริการของเราได้ เราขอแนะนำให้อัพเดตเบราว์เซอร์เพื่อการใช้งานที่ดีที่สุด

ไอที ธุรกิจ

อาลีบาบา ปล่อย AI ใหม่ สร้าง Digital Human เปลี่ยนรูปคนให้พูดได้

การเงินธนาคาร

อัพเดต 28 สิงหาคม 2568 เวลา 21.23 น. • เผยแพร่ 6 ชั่วโมงที่ผ่านมา

อาลีบาบา เปิดตัว Wan2.2-S2V โมเดลโอเพ่นซอร์สล่าสุด เปลี่ยนภาพถ่ายบุคคลให้เป็นอวทาร์ดิจิทัลที่พูด ร้องเพลง และแสดงท่าทางได้

วันที่ 28 สิงหาคม 2568 - อาลีบาบา เปิดตัว Wan2.2-S2V (Speech-to-Video) โมเดลโอเพ่นซอร์สล่าสุดที่ออกแบบมาสำหรับการสร้างวิดีโอมนุษย์ดิจิทัล (digital human video) ที่สามารถแปลงภาพถ่ายบุคคลให้กลายเป็นอวทาร์คุณภาพระดับภาพยนตร์ที่พูด ร้องเพลง และแสดงท่าทางได้

โมเดลนี้เป็นส่วนหนึ่งของ Wan2.2 ซึ่งเป็นชุดโมเดลการสร้างวิดีโอของอาลีบาบา โมเดลนี้สามารถสร้างวิดีโอแอนิเมชันคุณภาพสูงจากภาพภาพเดียวและคลิปเสียงหนึ่งคลิป

Wan2.2-S2V มอบความสามารถด้านการสร้างแอนิเมชันตัวละครที่หลากหลาย รองรับการสร้างวิดีโอได้หลายมุมมอง ทั้งแบบพอร์ตเทรต ครึ่งตัว และเต็มตัว อีกทั้งยังสามารถสร้างการเคลื่อนไหวของตัวละครและองค์ประกอบแวดล้อมแบบไดนามิกตามคำสั่งที่กำหนด ช่วยให้ครีเอเตอร์สามารถถ่ายทอดภาพได้อย่างแม่นยำ ตรงตามเรื่องราวและการออกแบบ

โมเดลนี้สามารถสร้างตัวละครที่แสดงได้เสมือนจริง ตั้งแต่บทสนทนาที่เป็นธรรมชาติ ไปจนถึงการแสดงดนตรี โดยอาศัยเทคโนโลยีแอนิเมชันที่ขับเคลื่อนด้วยเสียงที่มีประสิทธิภาพสูง และยังจัดการกับตัวละครหลายตัวภายในฉากได้อย่างราบรื่น ครีเอเตอร์สามารถแปลงเสียงบันทึกให้เป็นภาพเคลื่อนไหวที่สมจริง รองรับอวทาร์ที่หลากหลาย ตั้งแต่การ์ตูนและสัตว์ ไปจนถึงตัวละครที่มีสไตล์เฉพาะตัว

เทคโนโลยีนี้มอบความละเอียดของการแสดงผลที่ยืดหยุ่น ทั้ง 480P และ 720P เพื่อตอบโจทย์ความต้องการที่หลากหลายของคอนเทนต์ครีเอเตอร์มืออาชีพให้มั่นใจได้ว่าจะได้ภาพคุณภาพสูงที่ตรงตามมาตรฐานทางวิชาชีพและงานสร้างสรรค์ที่หลากหลาย จึงเหมาะอย่างยิ่งสำหรับคอนเทนต์บนสื่อโซเชียลและงานนำเสนอระดับมืออาชีพ

นวัตกรรมทางเทคโนโลยีที่หลากหลาย

Wan2.2-S2V มีประสิทธิภาพเหนือแอนิเมชันแบบ talking-head ด้วยการผสมผสานการควบคุมการเคลื่อนไหวหลักในภาพรวมด้วยคำสั่งจากข้อความ และการเคลื่อนไหวเฉพาะจุดที่มีรายละเอียดสูงด้วยข้อมูลจากเสียงเข้าด้วยกัน ทำให้ตัวละครเคลื่อนไหวได้อย่างเป็นธรรมชาติและสื่ออารมณ์ได้อย่างลึกซึ้ง แม้ในสถานการณ์ที่ซับซ้อนและท้าทาย

เทคนิคการประมวลผลเฟรมที่เป็นนวัตกรรมของโมเดลนี้ เป็นอีกหนึ่งความล้ำหน้าสำคัญ เทคโนโลยีนี้ช่วยลดค่าใช้จ่ายในการประมวลผลได้อย่างมีนัยสำคัญ จากการบีบอัดเฟรมที่มีอยู่เดิมซึ่งมีความยาวแบบไม่จำกัดให้เป็นภาพแฝง (latent representation) ที่มีขนาดกะทัดรัดเพียงภาพเดียว ซึ่งช่วยให้สามารถสร้างวิดีโอยาว ๆ ที่มีความเสถียรได้อย่างน่าทึ่ง เป็นการจัดการกับความท้าทายสำคัญในการผลิตคอนเทนต์แอนิเมชันที่ขยายเพิ่มเติม

ความสามารถที่ก้าวล้ำของโมเดลได้รับการยกระดับให้โดดเด่นยิ่งขึ้นด้วยกระบวนการเทรนที่ครอบคลุม ทีมวิจัยของอาลีบาบาได้สร้างชุดข้อมูลภาพและเสียงขนาดใหญ่ที่ออกแบบมาเพื่อรองรับการผลิตภาพยนตร์และรายการโทรทัศน์โดยเฉพาะ Wan2.2-S2V ได้รับการเทรนด้วยความละเอียดหลายระดับ (multi-resolution) จึงสามารถรองรับการสร้างวิดีโอได้หลายรูปแบบอย่างยืดหยุ่น ไม่ว่าจะเป็นคอนเทนต์วิดีโอสั้นที่ถ่ายทำแบบแนวตั้ง ไปจนถึงงานผลิตภาพยนต์และรายการโทรทัศน์แบบเดิมที่ถ่ายทำเป็นแนวนอน

Wan2.2-S2V พร้อมให้ดาวน์โหลดแล้วบน Hugging Face, GitHub และบน ModelScope ซึ่งเป็นคอมมิวนิตี้ด้านโอเพ่นซอร์สของอาลีบาบา คลาวด์ นอกจากนี้ในฐานะผู้มีส่วนร่วมสำคัญต่อชุมชนโอเพ่นซอร์สระดับโลก อาลีบาบาได้เปิดโอเพ่นซอร์สโมเดล Wan2.1 เมื่อเดือนกุมภาพันธ์ พ.ศ. 2568 และโมเดล Wan2.2 เมื่อเดือนกรกฎาคมที่ผ่านมา ปัจจุบันโมเดลที่อยู่ใน Wan series มียอดดาวน์โหลดรวมกว่า 6.9 ล้านครั้งบน Hugging Face และ ModelScope

อ่านข่าวที่เกี่ยวข้องกับ แวดวงเทคโนโลยี ทั่วโลก ได้ที่นี่

ดูข่าวต้นฉบับ
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

ล่าสุดจาก การเงินธนาคาร

3 สมมติฐาน คดีนายกฯ ส่งผลกระทบต่อเศรษฐกิจไทย

2 ชั่วโมงที่ผ่านมา

หุ้นไทย ปิดบวก 2.06 จุด Thailand Focus หนุน รอลุ้นผลคดีคลิปเสียงนายกฯพรุ่งนี้ปลดล็อกการเมือง

3 ชั่วโมงที่ผ่านมา

JD.com ครองอันดับ 1 บริษัทเอกชนใหญ่สุดในจีน รายได้ทะลุ 1 ล้านล้านหยวน

3 ชั่วโมงที่ผ่านมา

บิทคับ เอ็กซ์เชนจ์ ปล่อยแอปฯโฉมใหม่ (Beta Version) ชวนลูกค้าร่วมทดสอบฟีเจอร์เด็ด

3 ชั่วโมงที่ผ่านมา

วิดีโอแนะนำ

ข่าวและบทความไอที ธุรกิจอื่น ๆ

ศึกสายเลือดระอุ! 'สินี-สุนงค์' แถลงการณ์โต้ 'ชนินทธ์' ปมขัดแย้งมรดก-ดุสิตธานี

กรุงเทพธุรกิจ

‘อีเอสอาร์ไอ’ จัด ‘TUC 2025’ โชว์พลัง GIS ผสาน AI–คลาวด์ ยกระดับการจัดการวิกฤติ

กรุงเทพธุรกิจ

'เจโทร' ชี้ปัจจัยการเมืองไทยไม่กระทบลงทุน มั่นใจนโยบายรัฐต่อเนื่อง

กรุงเทพธุรกิจ

แจงเป้าหมาย กองทุน ววน. 20,000 ล้าน กระตุ้นเศรษฐกิจสังคมไทยสู่ความสมดุลและยั่งยืน

กรุงเทพธุรกิจ

กรมชลประทาน ย้ำพื้นที่ EEC ปริมาณน้ำเพียงพอใช้ ตลอดทั้งปี

กรุงเทพธุรกิจ

แอร์ GREE ปิดตำนาน 16 ปีในไทย ยุติจำหน่าย 1 ก.ย. 68 ลูกค้าเดิม ดูแลต่อ

ประชาชาติธุรกิจ

ราคาน้ำมันวันพรุ่งนี้ 29 ส.ค. เช็กราคาเบนซิน-ดีเซล-แก๊สโซฮอล์ล่าสุดที่นี่

The Bangkok Insight

คดีนายกฯ ชี้ชะตาตลาดหุ้น! 'บัวหลวง' วิเคราะห์ฉากทัศน์รอด หรือ ร่วง!

ทันหุ้น

ข่าวและบทความยอดนิยม

Loading...
Loading...
Loading...
รีโพสต์ (0)
Loading...
Loading...
Loading...
Loading...