Grok 4: Gen-AI ตัวใหม่ที่ฉลาด ที่สุดในโลกและก้าวสำคัญสู่ AGI

อัพเดต 11 ชั่วโมงที่ผ่านมา • เผยแพร่ 4 ชั่วโมงที่ผ่านมา

เมื่อวันก่อน ผมกำลังพูดคุยกับเพื่อน อยู่ๆ ก็มีเสียงแทรกเข้ามาร่วมสนทนาด้วย ตอนแรกผมก็งงว่ามีใครมาร่วมวงสนทนา แต่พอสังเกตดีๆ ก็พบว่าที่มาของเสียงสนทนาจากบุคคลที่สามนั้นมาจากเครื่อง iPad เพราะผมเปิดโปรแกรม AI Grok 4 ในโหมดสนทนาไว้ เราจึงให้Grok 4 เข้าร่วมสนทนาด้วย

แม้ผมเคยใช้ AI แชทบอทอย่าง Siri หรือแม้แต่ ChatGPT ในการสนทนา แต่ผมไม่เคยพบว่า AI ตัวไหนที่สามารถคุยเหมือนกับเพื่อนจริงๆ ได้ดีเท่าโปรแกรมนี้ มันเข้าใจบริบทได้ดี และมีความรู้สึกเหมือนมนุษย์ มีอารมณ์ขำขันและพูดคุยเป็นธรรมชาติมาก รวมทั้งยังสามารถค้นหาข้อมูล สอบถามข้อมูลต่างๆ ได้อย่างถูกต้อง ให้คำแนะนำต่างๆ ได้ดี จนทำให้เรารู้สึกว่ามีเพื่อนมาร่วมวงสนทนาอีกคนหนึ่ง

Grok 4 เป็นโมเดลเอไอรุ่นล่าสุดจากบริษัท xAI ซึ่งก่อตั้งโดย “อีลอน มัสก์” ผู้ร่วมก่อตั้งและซีอีโอของบริษัท Tesla เปิดตัวเมื่อปลายสัปดาห์ที่ผ่านมา โดยผลการทดสอบจากหลายๆ สำนักวิจัยพบว่า ขณะนี้ Grok 4 ได้กลายเป็นโมเดลที่ฉลาดที่สุดในโลก ด้วยความสามารถในการคิดวิเคราะห์และแก้ปัญหาที่ใกล้เคียงกับมนุษย์มากที่สุดเท่าที่เคยมีมา และมันยังถูกมองว่าเป็นก้าวสำคัญสู่การบรรลุ Artificial General Intelligence หรือ AGI ซึ่งคือเอไอที่สามารถคิดและเรียนรู้ได้เทียบเท่ามนุษย์ในทุกด้าน

ทั้งนี้ในการทดสอบของ ARC-AGI ซึ่งเป็นการทดสอบที่ง่ายสำหรับมนุษย์แต่ยากสำหรับเอไอ Grok 4 ทำคะแนนได้ 15.9% ซึ่งสูงกว่าโมเดลอื่นๆ เกือบสองเท่า โดยเฉพาะเมื่อเทียบกับ Claude 4 Opus ที่ได้เพียง 8.6% และ Gemini 2.5 Pro ที่ต่ำกว่านั้นอีก ทำให้ Grok 4 ถูกยกให้เป็นผู้นำในด้านการคิดแบบนามธรรมหรือ fluid intelligence ซึ่งเป็นกุญแจสำคัญสู่ AGI

แม้แต่การทดสอบ GPQA ชุดคำถามระดับบัณฑิตศึกษา Grok 4 ได้คะแนนสูงถึง 88.9% เหนือกว่าโมเดลอื่นๆ ซึ่งก็หมายความว่า เขาสามารถแก้ปัญหาทางวิทยาศาสตร์ คณิตศาสตร์ และฟิสิกส์ได้ในระดับที่เทียบเท่าหรือเหนือกว่านักศึกษาปริญญาเอกในหลายสาขา

นอกจากนี้ใน Humanity's Last Exam หรือ HLE ซึ่งเป็นการทดสอบปัญหาทั่วไปที่ค่อนข้างยากและครอบคลุมกว่า 2,500 คำถามจากผู้เชี่ยวชาญในคณิตศาสตร์ วิทยาศาสตร์ธรรมชาติ วิศวกรรมศาสตร์ และมนุษยศาสตร์ โมเดล Grok 4 Heavy สามารถทำคะแนนได้ 44.4% ซึ่งสูงกว่า Gemini 2.5 Pro ที่ได้ 26.9% และ OpenAI's o3 ที่ต่ำกว่านั้น โดยส่วนใหญ่โมเดลอื่นๆ ได้คะแนนเพียงหลักหน่วยเดียว

การทำคะแนนได้สูงใน HLE นี้ชี้ให้เห็นว่า Grok 4 ไม่ใช่แค่เก่งเฉพาะด้าน แต่สามารถจัดการกับปัญหาที่ต้องการความเข้าใจลึกซึ้งและเชื่อมโยงข้ามสาขาได้ดีเยี่ยม ซึ่งเป็นสัญญาณที่ชัดเจนของการเข้าใกล้ AGI

นอกจากนี้ ใน benchmarks อื่นๆ เช่น AIME (คณิตศาสตร์ระดับมัธยมปลาย) Grok 4 ก็เหนือกว่า o3 และ Claude 4 Opus หรือใน Vending-Bench ซึ่งทดสอบการแก้ปัญหาแบบสร้างสรรค์ Grok 4 ก็ครองอันดับหนึ่ง

ขณะที่ อีลอน มัสก์ ยังโพสต์บน X ว่า Grok 4 สามารถตอบคำถามเกี่ยวกับวัสดุศาสตร์ที่ไม่มีในหนังสือหรืออินเทอร์เน็ตได้อย่างถูกต้อง นอกจากนี้ Grok 4 ยังมีฟีเจอร์ที่สามารถใช้เครื่องมือภายนอก เช่น การค้นหาข้อมูลแบบเรียลไทม์ การวิเคราะห์ภาพ หรือแม้แต่การแก้ไขโค้ดโปรแกรมได้โดยตรง ผู้ใช้สามารถคัดลอกโค้ดทั้งไฟล์มาใส่ แล้วให้มันตรวจหาข้อผิดพลาดและแก้ไขให้

สำหรับปัญหายาก Grok 4 Heavy สามารถคิดแบบขนานเพื่อหาคำตอบที่ดีที่สุดได้ สำหรับคนทั่วไป นี่หมายถึงการใช้งานในชีวิตประจำวัน เช่น การวางแผนท่องเที่ยว การแก้ปัญหางาน หรือแม้แต่การเรียนรู้วิชาใหม่ๆ ที่ซับซ้อน โดยไม่ต้องพึ่งครูหรือหนังสือ และเพื่อให้เห็นภาพชัดเจนยิ่งขึ้น ลองดูตัวอย่างการใช้งานที่น่าสนใจที่ผู้คนกำลังทดลองกับ Grok 4 ในช่วงนี้ เช่น ในด้านการวิจัยทางวิชาการ ผู้ใช้สามารถอัปโหลดเอกสาร PDF ยาวกว่า 40 หน้าเกี่ยวกับ quantum entanglement แล้วให้มันสรุปข้อโต้แย้งหลัก รายชื่อสมมติฐานทั้งหมด และประเมินว่าสมมติฐานเหล่านั้นส่งผลต่อข้อสรุปอย่างไร จากนั้นเปรียบเทียบกับ consensus ล่าสุดจาก arXiv หลังปี 2024 ซึ่งช่วยนักวิจัยประหยัดเวลาได้มหาศาล

นอกจากนี้ ในงานพัฒนาซอฟต์แวร์ มันสามารถสร้างเว็บแอปเต็มรูปแบบ เขียนบทความทั้งหมด สรุปงานวิจัยเชิงลึก หรือรีวิวโค้ดมากกว่า 500 บรรทัดเพื่อหาข้อผิดพลาดและปรับปรุงประสิทธิภาพได้ในเวลาอันสั้น สำหรับนักลงทุนหรือนักข่าว มันทำหน้าที่เป็นตัวกรองสัญญาณรบกวน โดยค้นหาข่าวสารล่าสุดในหัวข้อเฉพาะ เช่น พัฒนาการ AI ในช่วง 2 วัน จากลิสต์ X ที่คัดสรรแล้ว กรองด้วยจำนวนรีทวีตขั้นต่ำ แล้วสรุปและจัดอันดับเรื่องราวสำคัญๆ เพื่อสร้างรายงานอัตโนมัติ

จากการเปิดตัวของ Grok 4 และเห็นคะแนนการทดสอบต่างๆ ทำให้ผมสนใจที่จะใช้ AI ตัวนี้เพิ่มขึ้นจากตัวเดิมๆ ที่เคยใช้เป็นประจำ และต้องยอมจ่ายเงินรายเดือนเพิ่มเติม แต่ก็ยังจ่ายเงินซื้อเฉพาะ SuperGrok เพื่อใช้โมเดล Grok 4 ทั่วไปเดือนละ $30 แต่ยังไม่กล้าที่จะจ่ายเป็นสมาชิกแบบพรีเมียมเดือนละ $300 เพื่อใช้ Grok 4 Heavy เพราะยังคิดว่าราคาค่อนข้างสูง Grok ก็นับว่าเป็นโมเดลตัวที่ 4 ที่ผมเพิ่มค่าใช้จ่ายในการใช้งานเป็นประจำ นอกเหนือจาก ChatGPT, Gemini และ Claude ที่ใช้แบบจ่ายรายเดือนอยู่แล้ว

หลายคนอาจคิดว่าราคา $20-$30 ต่อเดือนสำหรับโปรแกรมโมเดลเหล่านี้ดูค่อนข้างสูง และอาจตกใจที่เห็นราคาเวอร์ชั่นที่ดีขึ้นสูงถึง $100-$300 ต่อเดือน แต่ถ้าพิจารณาอีกมุมหนึ่งจะพบว่าโปรแกรมเหล่านี้ทำงานได้หลากหลายและเก่งกว่าคนทำงานทั่วไปในบางด้านเสียอีก

ดังนั้นจึงไม่แปลกที่จะเห็นองค์กรต่างๆ เริ่มซื้อโปรแกรมเหล่านี้มาใช้เพื่อให้พนักงานใช้งาน และก็มีแนวโน้มที่จะลดจำนวนพนักงานที่รับใหม่ เพราะหากพิจารณาค่าใช้จ่ายของโปรแกรมก็จะถูกกว่าอัตราเงินเดือนการจ้างพนักงานใหม่เสียอีก

ด้วยความสามารถของโมเดล Generative AI ที่เก่งขึ้นเรื่อยๆ และหลายๆ ด้านเริ่มแซงมนุษย์ ก็ทำให้เริ่มมีความกังวลว่า งานของคนอาจต้องปรับเปลี่ยน และงานหลายอย่างในหน่วยงาน เช่น งานด้านไอที งานเอกสาร งานการตลาด หรือแม้แต่บัญชี ก็สามารถนำ AI เข้ามาช่วยในการทำงานได้ และจะทำให้เกิดการลดความต้องการพนักงาน

เชื่อเถอะครับ… ถ้าโมเดล AI ยังพัฒนาต่อไปให้เก่งขึ้นเรื่อยๆ แบบก้าวกระโดดขนาดนี้ Grok 4 เป็นสัญญาณว่ายุค AGI กำลังใกล้เข้ามา ซึ่งจะนำพาโอกาสใหม่ๆ มาสู่มนุษยชาติ หากเราจัดการได้ดี มันจะช่วยแก้ปัญหาใหญ่ๆ ของโลก เช่น การเปลี่ยนแปลงสภาพภูมิอากาศหรือความยากจน แต่หากไม่ระวัง ก็อาจสร้างความไม่เท่าเทียมเพิ่มขึ้น มนุษย์จะต้องปรับตัวเองไปอย่างมาก เราต้องทำงานร่วมกับ AI และมีความเป็นไปได้ว่างานบางอย่าง AI ทำแทนเราได้ ดังนั้น การติดตามและมีส่วนร่วมกับเทคโนโลยีนี้จึงสำคัญสำหรับทุกคน ไม่ใช่แค่นักวิทยาศาสตร์เท่านั้น Generative AI คือจุดเริ่มต้นของอนาคตที่สดใส แต่เราต้องเดินไปด้วยกันอย่างมีสติ