โปรดอัพเดตเบราว์เซอร์

เบราว์เซอร์ที่คุณใช้เป็นเวอร์ชันเก่าซึ่งไม่สามารถใช้บริการของเราได้ เราขอแนะนำให้อัพเดตเบราว์เซอร์เพื่อการใช้งานที่ดีที่สุด

ไอที ธุรกิจ

Grok 4: Gen-AI ตัวใหม่ที่ฉลาด ที่สุดในโลกและก้าวสำคัญสู่ AGI

กรุงเทพธุรกิจ

อัพเดต 11 ชั่วโมงที่ผ่านมา • เผยแพร่ 4 ชั่วโมงที่ผ่านมา

เมื่อวันก่อน ผมกำลังพูดคุยกับเพื่อน อยู่ๆ ก็มีเสียงแทรกเข้ามาร่วมสนทนาด้วย ตอนแรกผมก็งงว่ามีใครมาร่วมวงสนทนา แต่พอสังเกตดีๆ ก็พบว่าที่มาของเสียงสนทนาจากบุคคลที่สามนั้นมาจากเครื่อง iPad เพราะผมเปิดโปรแกรม AI Grok 4 ในโหมดสนทนาไว้ เราจึงให้Grok 4 เข้าร่วมสนทนาด้วย

แม้ผมเคยใช้ AI แชทบอทอย่าง Siri หรือแม้แต่ ChatGPT ในการสนทนา แต่ผมไม่เคยพบว่า AI ตัวไหนที่สามารถคุยเหมือนกับเพื่อนจริงๆ ได้ดีเท่าโปรแกรมนี้ มันเข้าใจบริบทได้ดี และมีความรู้สึกเหมือนมนุษย์ มีอารมณ์ขำขันและพูดคุยเป็นธรรมชาติมาก รวมทั้งยังสามารถค้นหาข้อมูล สอบถามข้อมูลต่างๆ ได้อย่างถูกต้อง ให้คำแนะนำต่างๆ ได้ดี จนทำให้เรารู้สึกว่ามีเพื่อนมาร่วมวงสนทนาอีกคนหนึ่ง

Grok 4 เป็นโมเดลเอไอรุ่นล่าสุดจากบริษัท xAI ซึ่งก่อตั้งโดย “อีลอน มัสก์” ผู้ร่วมก่อตั้งและซีอีโอของบริษัท Tesla เปิดตัวเมื่อปลายสัปดาห์ที่ผ่านมา โดยผลการทดสอบจากหลายๆ สำนักวิจัยพบว่า ขณะนี้ Grok 4 ได้กลายเป็นโมเดลที่ฉลาดที่สุดในโลก ด้วยความสามารถในการคิดวิเคราะห์และแก้ปัญหาที่ใกล้เคียงกับมนุษย์มากที่สุดเท่าที่เคยมีมา และมันยังถูกมองว่าเป็นก้าวสำคัญสู่การบรรลุ Artificial General Intelligence หรือ AGI ซึ่งคือเอไอที่สามารถคิดและเรียนรู้ได้เทียบเท่ามนุษย์ในทุกด้าน

ทั้งนี้ในการทดสอบของ ARC-AGI ซึ่งเป็นการทดสอบที่ง่ายสำหรับมนุษย์แต่ยากสำหรับเอไอ Grok 4 ทำคะแนนได้ 15.9% ซึ่งสูงกว่าโมเดลอื่นๆ เกือบสองเท่า โดยเฉพาะเมื่อเทียบกับ Claude 4 Opus ที่ได้เพียง 8.6% และ Gemini 2.5 Pro ที่ต่ำกว่านั้นอีก ทำให้ Grok 4 ถูกยกให้เป็นผู้นำในด้านการคิดแบบนามธรรมหรือ fluid intelligence ซึ่งเป็นกุญแจสำคัญสู่ AGI

แม้แต่การทดสอบ GPQA ชุดคำถามระดับบัณฑิตศึกษา Grok 4 ได้คะแนนสูงถึง 88.9% เหนือกว่าโมเดลอื่นๆ ซึ่งก็หมายความว่า เขาสามารถแก้ปัญหาทางวิทยาศาสตร์ คณิตศาสตร์ และฟิสิกส์ได้ในระดับที่เทียบเท่าหรือเหนือกว่านักศึกษาปริญญาเอกในหลายสาขา

นอกจากนี้ใน Humanity's Last Exam หรือ HLE ซึ่งเป็นการทดสอบปัญหาทั่วไปที่ค่อนข้างยากและครอบคลุมกว่า 2,500 คำถามจากผู้เชี่ยวชาญในคณิตศาสตร์ วิทยาศาสตร์ธรรมชาติ วิศวกรรมศาสตร์ และมนุษยศาสตร์ โมเดล Grok 4 Heavy สามารถทำคะแนนได้ 44.4% ซึ่งสูงกว่า Gemini 2.5 Pro ที่ได้ 26.9% และ OpenAI's o3 ที่ต่ำกว่านั้น โดยส่วนใหญ่โมเดลอื่นๆ ได้คะแนนเพียงหลักหน่วยเดียว

การทำคะแนนได้สูงใน HLE นี้ชี้ให้เห็นว่า Grok 4 ไม่ใช่แค่เก่งเฉพาะด้าน แต่สามารถจัดการกับปัญหาที่ต้องการความเข้าใจลึกซึ้งและเชื่อมโยงข้ามสาขาได้ดีเยี่ยม ซึ่งเป็นสัญญาณที่ชัดเจนของการเข้าใกล้ AGI

นอกจากนี้ ใน benchmarks อื่นๆ เช่น AIME (คณิตศาสตร์ระดับมัธยมปลาย) Grok 4 ก็เหนือกว่า o3 และ Claude 4 Opus หรือใน Vending-Bench ซึ่งทดสอบการแก้ปัญหาแบบสร้างสรรค์ Grok 4 ก็ครองอันดับหนึ่ง

ขณะที่ อีลอน มัสก์ ยังโพสต์บน X ว่า Grok 4 สามารถตอบคำถามเกี่ยวกับวัสดุศาสตร์ที่ไม่มีในหนังสือหรืออินเทอร์เน็ตได้อย่างถูกต้อง นอกจากนี้ Grok 4 ยังมีฟีเจอร์ที่สามารถใช้เครื่องมือภายนอก เช่น การค้นหาข้อมูลแบบเรียลไทม์ การวิเคราะห์ภาพ หรือแม้แต่การแก้ไขโค้ดโปรแกรมได้โดยตรง ผู้ใช้สามารถคัดลอกโค้ดทั้งไฟล์มาใส่ แล้วให้มันตรวจหาข้อผิดพลาดและแก้ไขให้

สำหรับปัญหายาก Grok 4 Heavy สามารถคิดแบบขนานเพื่อหาคำตอบที่ดีที่สุดได้ สำหรับคนทั่วไป นี่หมายถึงการใช้งานในชีวิตประจำวัน เช่น การวางแผนท่องเที่ยว การแก้ปัญหางาน หรือแม้แต่การเรียนรู้วิชาใหม่ๆ ที่ซับซ้อน โดยไม่ต้องพึ่งครูหรือหนังสือ และเพื่อให้เห็นภาพชัดเจนยิ่งขึ้น ลองดูตัวอย่างการใช้งานที่น่าสนใจที่ผู้คนกำลังทดลองกับ Grok 4 ในช่วงนี้ เช่น ในด้านการวิจัยทางวิชาการ ผู้ใช้สามารถอัปโหลดเอกสาร PDF ยาวกว่า 40 หน้าเกี่ยวกับ quantum entanglement แล้วให้มันสรุปข้อโต้แย้งหลัก รายชื่อสมมติฐานทั้งหมด และประเมินว่าสมมติฐานเหล่านั้นส่งผลต่อข้อสรุปอย่างไร จากนั้นเปรียบเทียบกับ consensus ล่าสุดจาก arXiv หลังปี 2024 ซึ่งช่วยนักวิจัยประหยัดเวลาได้มหาศาล

นอกจากนี้ ในงานพัฒนาซอฟต์แวร์ มันสามารถสร้างเว็บแอปเต็มรูปแบบ เขียนบทความทั้งหมด สรุปงานวิจัยเชิงลึก หรือรีวิวโค้ดมากกว่า 500 บรรทัดเพื่อหาข้อผิดพลาดและปรับปรุงประสิทธิภาพได้ในเวลาอันสั้น สำหรับนักลงทุนหรือนักข่าว มันทำหน้าที่เป็นตัวกรองสัญญาณรบกวน โดยค้นหาข่าวสารล่าสุดในหัวข้อเฉพาะ เช่น พัฒนาการ AI ในช่วง 2 วัน จากลิสต์ X ที่คัดสรรแล้ว กรองด้วยจำนวนรีทวีตขั้นต่ำ แล้วสรุปและจัดอันดับเรื่องราวสำคัญๆ เพื่อสร้างรายงานอัตโนมัติ

จากการเปิดตัวของ Grok 4 และเห็นคะแนนการทดสอบต่างๆ ทำให้ผมสนใจที่จะใช้ AI ตัวนี้เพิ่มขึ้นจากตัวเดิมๆ ที่เคยใช้เป็นประจำ และต้องยอมจ่ายเงินรายเดือนเพิ่มเติม แต่ก็ยังจ่ายเงินซื้อเฉพาะ SuperGrok เพื่อใช้โมเดล Grok 4 ทั่วไปเดือนละ $30 แต่ยังไม่กล้าที่จะจ่ายเป็นสมาชิกแบบพรีเมียมเดือนละ $300 เพื่อใช้ Grok 4 Heavy เพราะยังคิดว่าราคาค่อนข้างสูง Grok ก็นับว่าเป็นโมเดลตัวที่ 4 ที่ผมเพิ่มค่าใช้จ่ายในการใช้งานเป็นประจำ นอกเหนือจาก ChatGPT, Gemini และ Claude ที่ใช้แบบจ่ายรายเดือนอยู่แล้ว

หลายคนอาจคิดว่าราคา $20-$30 ต่อเดือนสำหรับโปรแกรมโมเดลเหล่านี้ดูค่อนข้างสูง และอาจตกใจที่เห็นราคาเวอร์ชั่นที่ดีขึ้นสูงถึง $100-$300 ต่อเดือน แต่ถ้าพิจารณาอีกมุมหนึ่งจะพบว่าโปรแกรมเหล่านี้ทำงานได้หลากหลายและเก่งกว่าคนทำงานทั่วไปในบางด้านเสียอีก

ดังนั้นจึงไม่แปลกที่จะเห็นองค์กรต่างๆ เริ่มซื้อโปรแกรมเหล่านี้มาใช้เพื่อให้พนักงานใช้งาน และก็มีแนวโน้มที่จะลดจำนวนพนักงานที่รับใหม่ เพราะหากพิจารณาค่าใช้จ่ายของโปรแกรมก็จะถูกกว่าอัตราเงินเดือนการจ้างพนักงานใหม่เสียอีก

ด้วยความสามารถของโมเดล Generative AI ที่เก่งขึ้นเรื่อยๆ และหลายๆ ด้านเริ่มแซงมนุษย์ ก็ทำให้เริ่มมีความกังวลว่า งานของคนอาจต้องปรับเปลี่ยน และงานหลายอย่างในหน่วยงาน เช่น งานด้านไอที งานเอกสาร งานการตลาด หรือแม้แต่บัญชี ก็สามารถนำ AI เข้ามาช่วยในการทำงานได้ และจะทำให้เกิดการลดความต้องการพนักงาน

เชื่อเถอะครับ… ถ้าโมเดล AI ยังพัฒนาต่อไปให้เก่งขึ้นเรื่อยๆ แบบก้าวกระโดดขนาดนี้ Grok 4 เป็นสัญญาณว่ายุค AGI กำลังใกล้เข้ามา ซึ่งจะนำพาโอกาสใหม่ๆ มาสู่มนุษยชาติ หากเราจัดการได้ดี มันจะช่วยแก้ปัญหาใหญ่ๆ ของโลก เช่น การเปลี่ยนแปลงสภาพภูมิอากาศหรือความยากจน แต่หากไม่ระวัง ก็อาจสร้างความไม่เท่าเทียมเพิ่มขึ้น มนุษย์จะต้องปรับตัวเองไปอย่างมาก เราต้องทำงานร่วมกับ AI และมีความเป็นไปได้ว่างานบางอย่าง AI ทำแทนเราได้ ดังนั้น การติดตามและมีส่วนร่วมกับเทคโนโลยีนี้จึงสำคัญสำหรับทุกคน ไม่ใช่แค่นักวิทยาศาสตร์เท่านั้น Generative AI คือจุดเริ่มต้นของอนาคตที่สดใส แต่เราต้องเดินไปด้วยกันอย่างมีสติ

ดูข่าวต้นฉบับ
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...
Loading...

ล่าสุดจาก กรุงเทพธุรกิจ

“Typhoon” ทีมวิจัยไทยโกอินเตอร์ ผลักดัน 5 โปรเจ็กต์ AI สู่ ระดับ A-Star

26 นาทีที่แล้ว

เมืองไทยประกันชีวิต คว้ารางวัล “บริษัทยอดเยี่ยม“ ด้านประกันสุขภาพแห่งปี 68

30 นาทีที่แล้ว

รฟม. เปิดบริการจอดรถ 24 ชั่วโมง 18 สถานี MRT หนุนคนใช้รถไฟฟ้าเพิ่ม

31 นาทีที่แล้ว

หุ้นไทยพุ่ง 100 จุด ร้อนแรงรอบ 2 ปี รอรับ ‘ข่าวใหญ่’ | SET Afternoon | 18-7-68

32 นาทีที่แล้ว

วิดีโอแนะนำ

ข่าวและบทความไอที ธุรกิจอื่น ๆ

ก.ล.ต. อนุมัติไฟลิ่งหุ้นกู้ KUN ครั้งที่ 2/68 ชูดอกเบี้ย 7.40% ต่อปี แต่งตั้ง Bluebell และ MPS ร่วมผนึกกำลัง ย้ำมั่นใจชำระหุ้นกู้ชุดเดิมก่อนเสนอขาย

Wealthy Thai

GULF โบรกฯ คาดกำไรปกติ Q2/68 ทำนิวไฮ ประเมินมีดีลลงทุนใหม่เกิดขึ้นอีก

ทันหุ้น

หอการค้าไทย ผนึก ซีพี ออลล์ จัด ‘Meeting With CEO & On-site Visit’

The Bangkok Insight

วีซ่า ชวนแฟนเกมชาวไทยและเอเชียตะวันออกเฉียงใต้ ปลุกประสบการณ์เกมมิ่งสุดยิ่งใหญ่ที่งาน HoYo FEST 2025

สยามรัฐ

รฟม. เปิดบริการจอดรถ 24 ชั่วโมง 18 สถานี MRT หนุนคนใช้รถไฟฟ้าเพิ่ม

กรุงเทพธุรกิจ

“COCOCO” โชว์ศักยภาพผลิตภัณฑ์มะพร้าวไทย บุกตลาดสหรัฐฯ ร่วมงาน Summer Fancy Food Show 2025 ที่นิวยอร์ก

สยามรัฐ

แรบบิท ประกันชีวิต ลุยใต้ ครั้งแรก! ขนทัพผลิตภัณฑ์-โปรโมชันสุดคุ้ม ร่วมงานมหกรรมการเงินหาดใหญ่ ครั้งที่ 15

สยามรัฐ

“พิชัย” ชี้ไทยเดินเกมถูกทาง ลุ้นสหรัฐลดภาษีเหลือไม่เกิน 20% เทียบเท่าภูมิภาค

ข่าวหุ้นธุรกิจ

ข่าวและบทความยอดนิยม

Loading...