SCB 10X ส่ง 5 งานวิจัยร่วมด้าน AI สู่เวทีประชุมวิชาการนานาชาติ
‘กลุ่มเอสซีบีเอกซ์’ หวังพัฒนาและผลักดันงานวิจัยสู่ระดับโลก โดยเน้นเป้าหมายสู่การสร้าง ‘A-Star (A*) Research’ หรือผลงานวิจัยที่ได้รับการยอมรับในงานประชุมวิชาการระดับสูงสุดของโลกที่จัดอันดับโดยองค์กร CORE (Computing Research and Education Association of Australasia) ซึ่งถือเป็นกลไกสำคัญในการยกระดับศักยภาพนักวิจัยไทยและสร้างอิทธิพลทางความรู้ในระดับนานาชาติ
ล่าสุด ทีมวิจัย Typhoon จาก SCB 10X บริษัทด้านการลงทุนในเทคโนโลยีปฏิวัติวงการ (Disruptive Technology) ภายใต้กลุ่มเอสซีบีเอกซ์ส่ง 5 ผลงานวิจัยร่วมด้านเทคโนโลยีปัญญาประดิษฐ์ (AI) เข้าสู่การประชุม Association for Computational Linguistics (ACL) 2025 เวทีประชุมวิชาการระดับโลกด้านการประมวลผลภาษาธรรมชาติและภาษาศาสตร์คอมพิวเตอร์ที่ทรงเกียรติที่สุดแห่งหนึ่งของโลก
ความสำเร็จครั้งนี้เป็นผลจากความร่วมมือในการทำวิจัยร่วมกับสถาบันชั้นนำ 4 แห่ง ได้แก่ สถาบันวิทยสิริเมธี (VISTEC) มหาวิทยาลัยสแตนฟอร์ด มหาวิทยาลัยเคมบริดจ์ และเครือข่ายวิจัย SEACrowd โดยแบ่งเป็น 3 งานใน Main Conference, 1 งานใน Findings และ 1 งานใน LLM Security Workshop
กวีวุฒิ เต็มภูวภัทร ประธานเจ้าหน้าที่บริหาร SCB 10X กล่าวว่า “เรารู้สึกเป็นเกียรติอย่างยิ่งที่ผลงานวิจัยทั้ง 5 ชิ้นที่ทีม Typhoon มีส่วนร่วมได้รับการตอบรับให้เผยแพร่ในงานประชุม ACL 2025 ซึ่งเป็นงานประชุมวิชาการระดับนานาชาติด้าน AI โดยเฉพาะอย่างยิ่งการประมวลผลภาษาธรรมชาติ (NLP) และภาษาศาสตร์คอมพิวเตอร์ที่ทรงเกียรติที่สุดงานหนึ่งของโลก มีระบบ peer review ที่เข้มข้นและได้รับความสนใจสูงจากชุมชนวิจัยนานาชาติ”
5 ผลงานวิจัยร่วมของทีม Typhoon ในงานประชุม ACL 2025 ได้แก่
ผลงานใน Main Conference 3 เรื่อง ได้แก่
SkillAggregation: Reference-free LLM-Dependent Aggregation ผลงานวิจัยร่วมกับมหาวิทยาลัยเคมบริดจ์ และมหาวิทยาลัยสแตนฟอร์ด – การรวมผลจากโมเดล LLM หลายภาษาโดยไม่ต้องใช้ข้อมูลคำตอบจริง (reference labels) โดยใช้วิธีเรียนรู้ความแม่นยำของแต่ละโมเดลจากบริบท ช่วยให้การตัดสินใจแม่นยำและปรับตามสถานการณ์ได้ดีขึ้น พร้อมผลลัพธ์ที่เหนือกว่าวิธีเดิมในการประเมินคุณภาพของ LLM
Mind the Gap! Static and Interactive Evaluations of Large Audio Models ผลงานวิจัยร่วมกับมหาวิทยาลัยสแตนฟอร์ด – วิธีการประเมินโมเดลเสียงขนาดใหญ่ (Large Audio Models) ด้านรูปแบบ (preferences) และความเข้าใจคำสั่งของผู้ใช้ (user needs) ผ่านการโต้ตอบโดยตรง
Crowdsource, Crawl, or Generate? Creating SEA-VL, a Multicultural Vision-Language Dataset for Southeast Asia ผลงานวิจัยร่วมกับ SEACrowd – การสร้างชุดข้อมูลภาพ-ภาษาคุณภาพสูงที่สะท้อนวัฒนธรรมเอเชียตะวันออกเฉียงใต้ โดยประกอบไปด้วยรูปภาพที่เกี่ยวข้องจำนวน 1.28 ล้านรูป
ผลงานใน Findings 1 เรื่อง คือ Towards Better Understanding of Program-of-Thought Reasoning in Cross-Lingual and Multilingual Environments ผลงานวิจัยร่วมกับสถาบันวิทยสิริเมธี (VISTEC) – งานวิจัยนี้ศึกษาวิธีปรับปรุงความสามารถในการให้เหตุผลของ AI ในสภาพแวดล้อมหลายภาษา โดยใช้เทคนิค Program-of-Thought (PoT) ซึ่งแยกขั้นตอนการคิดออกจากการคำนวณ เพื่อให้โมเดลเข้าใจและให้คำตอบได้แม่นยำยิ่งขึ้น
ผลงานใน LLM Security Workshop 1 เรื่อง คือ Shortcut Learning in Safety: The Impact of Keyword Bias in Safeguards [ผลงานวิจัยร่วมกับสถาบันวิทยสิริเมธี (VISTEC)] – ศึกษาผลกระทบในการแยกแยะประเภทของคำสั่ง (prompt) จากพฤติกรรมจดจำคำสัญ (keyword bias) ในโมเดลประเภท safeguard
ผลงานวิจัยเหล่านี้เป็นรากฐานสำคัญเบื้องหลังการพัฒนาโมเดลปัญญาประดิษฐ์ของ SCB 10X เช่น Typhoon T1, Typhoon2 R1 และ Typhoon2 Audio ที่ถูกนำเสนอในงานประชุมระดับโลกดังกล่าว พร้อมทั้งมีการเผยแพร่ technical reports ผ่านแพลตฟอร์ม OpenTyphoon.aiเพื่อเปิดโอกาสให้นักวิจัยทั่วโลกสามารถเข้าถึงองค์ความรู้และนำไปต่อยอดได้อย่างเสรี และแม้ว่าในแต่ละงานวิจัยจะมีประเด็นเฉพาะของตนเอง แต่ทั้งหมดล้วนสะท้อนจุดมุ่งหมายร่วมกัน คือ การพัฒนา AI ที่เข้าใจบริบท ครอบคลุมความหลากหลาย และนำไปใช้ได้จริง
แม้จะยังไม่มีการจัดอันดับอย่างเป็นทางการในระดับประเทศเกี่ยวกับการมีส่วนร่วมใน A* Conference แต่ประเทศไทยเริ่มเห็นสัญญาณของการเติบโตในสายนี้ โดยมีองค์กรที่ลงมือทำงานอย่างจริงจัง อาทิ กลุ่มเอสซีบีเอกซ์ VISTEC และจุฬาลงกรณ์มหาวิทยาลัย เป็นต้น ซึ่งองค์กรเหล่านี้กำลังสร้างฐานรากที่สำคัญในการผลักดันให้นักวิจัยไทยได้มีพื้นที่ในเวทีโลก