Grok: แชทบอท "ค้นหาความจริงสูงสุด" ของ Elon Musk

Grok คือแชทบ็อตปัญญาประดิษฐ์ที่พัฒนาโดย xAI ซึ่งเป็นบริษัทวิจัยที่ก่อตั้งโดย Elon Musk เช่นเดียวกับแชทบ็อตยอดนิยมอื่นๆ Grok สามารถสร้างข้อความหรือโค้ด วิเคราะห์ข้อมูล และแก้ปัญหาที่ซับซ้อนได้ อย่างไรก็ตาม สิ่งที่ทำให้ Grok แตกต่างคืออารมณ์ขันและการคิดนอกกรอบ ในบทความนี้ เราจะมาสำรวจประวัติ ความสามารถ และคุณสมบัติที่โดดเด่นของแชทบ็อต

ประวัติของโกรก

อีลอน มัสก์ร่วมก่อตั้ง OpenAI (หรือที่รู้จักกันในชื่อ ChatGPT) ในปี 2015 แต่ลาออกจากบริษัทหลังจากนั้น 3 ปี เนื่องจาก "เขาไม่เห็นด้วยกับสิ่งที่ทีมงาน OpenAI ต้องการทำ"

ในเดือนเมษายน 2023 อีลอน มัสก์กล่าวในการสัมภาษณ์ว่า ChatGPT มีความถูกต้องทางการเมืองมากเกินไป ในขณะที่เขาตั้งใจที่จะสร้าง "AI ที่แสวงหาความจริงสูงสุดซึ่งพยายามทำความเข้าใจธรรมชาติของจักรวาล" ชื่อชั่วคราวสำหรับโปรเจ็กต์นี้คือ TruthGPT (มาจากคำว่า 'truth' ในภาษาอังกฤษ)"

อีลอน มัสก์ เปิดตัว TruthGPT

ในที่สุดพวกเขาก็เปลี่ยนชื่อเป็น Grok ซึ่งได้รับแรงบันดาลใจจากนวนิยายวิทยาศาสตร์เรื่อง “Stranger in a Strange Land” ของ Robert A. Heinlein ในปี 1961 ซึ่งคำว่า “grok” หมายถึงการเข้าใจบางสิ่งบางอย่างอย่างลึกซึ้งและโดยสัญชาตญาณ

Grok เวอร์ชันแรกเปิดตัวในเดือนพฤศจิกายน 2023
ในเดือนมีนาคม 2024 ได้รับการอัปเกรดเป็น Grok-1.5 ซึ่งมีคุณสมบัติทางตรรกะของชายแดนและหน้าต่างบริบทที่ใหญ่กว่าที่มีโทเค็น 128,000 โทเค็น
ในเดือนธันวาคม 2024 Grok-2 ได้เปิดตัว โมเดลนี้สามารถประมวลผลได้ทั้งข้อความและรูปภาพ
ในที่สุด Grok 3 ได้เปิดตัวในเดือนกุมภาพันธ์ 2025 อีลอน มัสก์เรียกโมเดลนี้ว่า “ฉลาดอย่างน่ากลัว”

เวอร์ชันใหม่นี้ได้รับการฝึกฝนบนซูเปอร์คอมพิวเตอร์ Colossus ซึ่งมีพลังการประมวลผลมากกว่าโมเดลล้ำสมัยรุ่นก่อนถึง 10 เท่า

ผลงานของโกรก

อีลอน มัสก์กล่าวว่า Grok 3 คือ AI ที่ชาญฉลาดที่สุดในโลก มันดีอย่างที่โฆษณาไว้จริงหรือไม่ มาดูกัน:

Grok 3 แสดงความแม่นยำสูงกว่ารุ่นก่อนหน้า 20% โดยได้รับการยืนยันผ่านมาตรฐาน NLP และ AI ของอุตสาหกรรม
ความเร็วในการประมวลผลเร็วขึ้น 25% และความแม่นยำเพิ่มขึ้น 15% ในด้านความเข้าใจภาษาธรรมชาติและการสร้างการตอบสนองเมื่อเปรียบเทียบกับ ChatGPT o1 pro และ DeepSeek R1
ผลลัพธ์ที่น่าประทับใจในเกณฑ์มาตรฐานคณิตศาสตร์ วิทยาศาสตร์ และการเขียนโค้ด

คณิตศาสตร์ วิทยาศาสตร์ การเขียนโค้ด

เกณฑ์มาตรฐานเพิ่มเติม:

คณิตศาสตร์ วิทยาศาสตร์ธรรมชาติ การเขียนโค้ด ความเข้าใจหลายรูปแบบ

ดังที่เราเห็นได้จากภาพด้านบน Grok 3 ทำได้ดีมากในด้านต่างๆ ดังนี้:

คณิตศาสตร์ (AIME’25 และ AIME’24)
วิทยาศาสตร์ธรรมชาติ เช่น ชีววิทยา ฟิสิกส์ และเคมี (GPQA)
การเข้ารหัส (LCB)
ความเข้าใจหลายรูปแบบ (MMMU)

เกณฑ์มาตรฐาน MMMU เพียงเกณฑ์เดียวก็มีคำถาม 11,500 ข้อที่ครอบคลุมหัวข้อต่างๆ ในทุกสาขาวิชา รวมถึงศิลปะและการออกแบบ ธุรกิจ สุขภาพและการแพทย์ วิทยาศาสตร์ มนุษยศาสตร์และสังคมศาสตร์ และเทคโนโลยีและวิศวกรรมศาสตร์

ตัวอย่าง MMMU

Grok-3 เวอร์ชันแรก (ชื่อรหัส “Chocolate”) ได้รับตำแหน่งที่ 1 ใน LMSYS Arena (แพลตฟอร์มที่ออกแบบมาเพื่อประเมินและเปรียบเทียบโมเดลภาษาขนาดใหญ่ที่แตกต่างกันในสภาพแวดล้อมการแข่งขัน) ทำให้เป็นโมเดล AI แรกที่มีคะแนนเกิน 1,400 คะแนนในทุกหมวดหมู่

รุ่นปัจจุบันของ Grok

Grok 3 มีรูปร่างและขนาดที่แตกต่างกัน รุ่นเรือธงเรียกว่า Grok 3 มีคุณสมบัติเชิงลึกเกี่ยวกับการเงิน การดูแลสุขภาพ กฎหมาย และวิทยาศาสตร์ รุ่นน้ำหนักเบาเรียกว่า Grok 3 mini มีคุณสมบัติรวดเร็ว ชาญฉลาด และยอดเยี่ยมสำหรับงานที่อิงตามตรรกะซึ่งไม่จำเป็นต้องมีความรู้เชิงลึกเกี่ยวกับโดเมน

นอกจากนี้ยังมีรุ่นเร็ว (grok-3-fast-beta และ grok-3-mini-beta) ที่ใช้รูปแบบพื้นฐานเดียวกันและให้คุณภาพการตอบสนองที่เหมือนกัน แต่ให้บริการบนโครงสร้างพื้นฐานที่เร็วกว่า ส่งผลให้เวลาในการตอบสนองเร็วขึ้นอย่างเห็นได้ชัด

ข้อมูลทางเทคนิค
ความเร็วในการประมวลผล	1.5 เพตาฟล็อป
พารามิเตอร์	2.7 ล้านล้าน
โทเค็นการฝึกอบรม	12.8 ล้านล้าน
ความหน่วงในการตอบสนอง	67 มิลลิวินาที (โดยเฉลี่ย)
หน้าต่างบริบท	131072 โทเค็น

Grok สามารถวิเคราะห์ภาพได้ (อธิบายภาพ ระบุวัตถุ อ่านข้อความ) :

ขนาดภาพสูงสุด: 10MiB
จำนวนภาพสูงสุด: ไม่มีขีดจำกัด
ประเภทไฟล์ภาพที่รองรับ: jpg, jpeg, png
ยอมรับคำสั่งป้อนภาพ/ข้อความใดๆ ก็ได้

นอกจากนี้ Grok ยังสามารถสร้างภาพคุณภาพสูงได้โดยใช้โมเดลการสร้างภาพอัตโนมัติที่มีชื่อรหัสว่า Aurora โมเดลนี้รองรับอินพุตแบบมัลติโมดัลในตัว ซึ่งช่วยให้สามารถดึงแรงบันดาลใจหรือแก้ไขรูปภาพที่ผู้ใช้จัดเตรียมมาได้โดยตรง โปรดทราบว่า Aurora พร้อมใช้งานบนแพลตฟอร์ม X แต่ไม่จำเป็นต้องพร้อมใช้งานบนแพลตฟอร์มอื่น

โมเดล Grok บน API อย่างเป็นทางการไม่ได้เชื่อมต่อกับอินเทอร์เน็ต ซึ่งหมายความว่าโมเดลเหล่านี้ไม่มีข้อมูลเหตุการณ์โลกหลังจากวันที่ 17 พฤศจิกายน 2024

การฝึกอบรมของ Grok

นักพัฒนาได้ปรับแนวทางการฝึกอบรมโดยรวมเอาชุดข้อมูลสังเคราะห์ กลไกการแก้ไขตัวเอง และการเรียนรู้แบบเสริมแรง เพื่อปรับปรุงประสิทธิภาพของ Grok 3:

ชุดข้อมูลสังเคราะห์ ซึ่งเป็นข้อมูลที่สร้างขึ้นโดยเทียมเพื่อเลียนแบบข้อมูลในโลกแห่งความเป็นจริงโดยไม่ใช้ข้อมูลที่ละเอียดอ่อนหรือเป็นกรรมสิทธิ์ ชุดข้อมูลเหล่านี้ใช้เพื่อฝึกอบรมโมเดลภาษาโดยจำลองสถานการณ์ต่างๆ เพื่อให้แน่ใจว่าได้ชุดข้อมูลที่หลากหลายและควบคุมได้ ซึ่งจะช่วยเพิ่มประสิทธิภาพการเรียนรู้และแก้ไขข้อกังวลเรื่องความเป็นส่วนตัวของข้อมูล
กลไกการแก้ไขตัวเอง Grok-3 มีความสามารถในตัวในการตรวจสอบข้อเท็จจริงและปรับแต่งคำตอบของตัวเองเมื่อเวลาผ่านไป ระบบจะเปรียบเทียบคำตอบกับแหล่งข้อมูลที่เชื่อถือได้ ตรวจหาจุดที่ผิดพลาด และปรับแต่งแนวทางสำหรับครั้งต่อไป การปรับปรุงตัวเองอย่างต่อเนื่องนี้หมายความว่ายิ่งคุณใช้ระบบนี้มากเท่าไร ก็จะยิ่งทำผิดพลาดน้อยลงเท่านั้น และค่อยๆ เข้าใกล้ความแม่นยำในการตอบกลับแบบมนุษย์มากขึ้น ระบบนี้ไม่ได้ไร้ที่ติ แต่ได้รับการออกแบบมาให้เรียนรู้จากการโต้ตอบทุกครั้ง
การเรียนรู้แบบเสริมแรง การเรียนรู้ของเครื่องจักรประเภทหนึ่งที่โมเดล AI เรียนรู้โดยรับรางวัลหรือบทลงโทษสำหรับการกระทำของมัน คล้ายกับที่มนุษย์เรียนรู้ทักษะผ่านประสบการณ์ ระบบได้รับการฝึกฝนเพื่อเพิ่มผลลัพธ์เชิงบวกให้สูงสุดผ่านการลองผิดลองถูก เพื่อปรับปรุงความสามารถในการตัดสินใจ

เทคนิคเหล่านี้ช่วยลดการตอบสนองที่ไม่ถูกต้อง ซึ่งเรียกว่าอาการประสาทหลอน โดยใช้ขั้นตอนการตรวจสอบหลายขั้นตอน และปรับตัวได้อย่างมีประสิทธิภาพมากขึ้นผ่านการประเมินและการเรียนรู้ด้วยตนเองอย่างต่อเนื่อง

เพื่อให้การตอบสนองของ Grok เป็นธรรมชาติและเกี่ยวข้องมากขึ้น นักพัฒนาจึงได้แนะนำวงจรข้อเสนอแนะของมนุษย์ (วิธีการฝึกที่มนุษย์ประเมินความถูกต้อง ความเกี่ยวข้อง และประโยชน์ของเนื้อหาที่สร้างขึ้นโดยเทียม) และการฝึกตามบริบท (สอนให้บอตพิจารณาการโต้ตอบก่อนหน้านี้ เจตนาของผู้ใช้ และข้อมูลโดยรอบเพื่อสร้างคำตอบที่แม่นยำและเกี่ยวข้องมากขึ้น)

ลักษณะเฉพาะตัวของ Grok

แม้ว่าโมเดล AI ส่วนใหญ่จะใช้โทนเสียงที่เป็นทางการ (และมักจะให้ความรู้สึกเหมือนหุ่นยนต์) แต่ Grok 3 โดดเด่นด้วยสไตล์ที่กล้าหาญและประชดประชัน โดยไม่กลัวที่จะใช้ความตลก เสียดสี และการใช้สำนวนที่ไม่ธรรมดา Grok ให้ความสำคัญกับการตอบสนองที่เป็นข้อเท็จจริงและไม่ลำเอียง ซึ่งมักจะท้าทายเรื่องเล่าที่เป็นที่นิยม ในขณะที่เครือข่ายประสาทอื่นๆ หลีกเลี่ยงการพูดคุยถึงหัวข้อที่ซับซ้อน Grok กลับใช้แนวทางที่แตกต่างออกไป โดยไม่กลัวที่จะพูดคุยเกี่ยวกับปรัชญา การเมือง หรือปัญหาทางจริยธรรม Grok สามารถพิจารณามุมมองที่หลากหลาย และยอมรับได้เมื่อไม่แน่ใจ ซึ่งเป็นความซื่อสัตย์ที่หายากในแชทบอต ซึ่งทำให้ Grok รู้สึกเหมือนเป็นคู่สนทนาแทนที่จะเป็นเครื่องตอบคำถามทั่วๆ ไป

Grok 3 มีประโยชน์สำหรับเกษตรกร นักธุรกิจ คนขับรถ และผู้สร้างคอนเทนต์

Grok ถูกสร้างขึ้นด้วยภารกิจในการให้คำตอบที่เป็นประโยชน์และจริงใจที่สุด บอทจะทำงานได้ดีเมื่อต้องจัดการกับคำถามที่ซับซ้อนหรือคำถามปลายเปิด ในขณะที่แชทบอทจำนวนมากมีความโดดเด่นในด้านการให้ข้อมูลอย่างรวดเร็วหรือการตอบกลับแบบมีสคริปต์ Grok ได้รับการออกแบบมาเพื่อจัดการกับคำถามที่ละเอียดอ่อน โดยเฉพาะอย่างยิ่งในด้านต่างๆ เช่น วิทยาศาสตร์และการคิดวิเคราะห์ มันสามารถแบ่งหัวข้อที่ซับซ้อน เช่น กลศาสตร์ควอนตัมหรือปัญหาทางจริยธรรม ออกเป็นคำอธิบายที่เข้าใจง่ายโดยไม่ทำให้ง่ายลง ซึ่งทำให้เป็นที่ชื่นชอบของผู้ใช้ที่ต้องการมากกว่าคำตอบระดับผิวเผิน ไม่ว่าจะเป็นนักเรียน นักวิจัย หรือผู้ที่มีความอยากรู้อยากเห็น

นอกจากนี้ ผู้ใช้ยังสังเกตว่าบอทนี้เซ็นเซอร์คำตอบน้อยกว่า ChatGPT หรือ Claude มาก อย่างไรก็ตาม Grok มีโปรโตคอลความปลอดภัยเพื่อป้องกันคำแนะนำที่เป็นอันตรายหรือผิดกฎหมาย เช่น การสร้างระเบิด หากคุณถาม บอทจะเบี่ยงเบนความสนใจ บางทีอาจอธิบายวิทยาศาสตร์เกี่ยวกับวัตถุระเบิดในลักษณะทั่วไปที่ไม่ให้ความรู้ หรือพูดว่า "อย่าระเบิดสิ่งของเลย เรามาสำรวจสิ่งที่... ไม่ติดไฟกันดีกว่าไหม" วิธีการนี้จะช่วยรักษาสมดุลระหว่างความเปิดกว้างและความรับผิดชอบ ซึ่งแตกต่างจากแชทบอตบางตัวที่อาจยุติการสนทนาโดยสิ้นเชิงหรือให้คำตอบที่คลุมเครือมากเกินไป

อนาคตของโกรก

Elon Musk กล่าวในการถ่ายทอดสดว่า Grok 3 จะมีโหมดเสียงในเร็วๆ นี้ โดยผู้ใช้จะสามารถสนทนากับแชทบอต Grok ได้ผ่านคำสั่งพูด และรับคำตอบแบบเสียงที่สร้างโดย AI ด้วยการนำโหมดเสียงมาใช้ใน Grok 3 ผู้ใช้จะได้สัมผัสกับวิธีการที่เป็นธรรมชาติและโต้ตอบได้มากขึ้นในการมีส่วนร่วมกับ AI ทำให้เส้นแบ่งระหว่างการสื่อสารระหว่างมนุษย์และเครื่องจักรเลือนลางลง

ฟีเจอร์พรีเมียม เช่น DeepSearch โหมด Think และโหมด Big Brain กำลังจะมีให้ใช้งานสำหรับผู้ชมในวงกว้างขึ้น DeepSearch คือเสิร์ชเอ็นจิ้นของ Grok ที่ได้รับการออกแบบมาเพื่อเข้าถึงข่าวสารล่าสุดแบบเรียลไทม์ สังเคราะห์ข้อมูลสำคัญ ให้เหตุผลเกี่ยวกับข้อเท็จจริงและความคิดเห็นที่ขัดแย้งกัน และกลั่นกรองความชัดเจนจากความซับซ้อน โหมด Think มอบแนวทางแบบห่วงโซ่แห่งความคิดให้กับคำสั่งของผู้ใช้ ผลลัพธ์คือรายละเอียดทีละขั้นตอนของการใช้เหตุผลของโมเดล เหมาะสำหรับคำถามที่ซับซ้อนที่ต้องใช้ตรรกะอย่างรอบคอบ เช่น โจทย์คณิตศาสตร์ คำถามเชิงปรัชญา หรือคำอธิบายทางเทคนิค โหมด Big Brain เป็นโหมดที่ครอบคลุม สร้างสรรค์ หรือเน้นการคำนวณมากขึ้น ซึ่งใช้ประโยชน์จากบริบทที่กว้างขึ้น การจดจำรูปแบบขั้นสูง หรือฐานความรู้ที่ใหญ่กว่า เหมาะอย่างยิ่งสำหรับการจัดการกับคำถามที่มีหลายแง่มุมหรือปลายเปิด การสร้างสรรค์แนวคิดใหม่ๆ หรือการเชื่อมโยงจุดต่างๆ ข้ามโดเมนที่หลากหลาย โหมดนี้อาจจำลองระดับการแยกส่วนหรือสัญชาตญาณที่สูงกว่า

ในส่วนของฮาร์ดแวร์ ซูเปอร์คอมพิวเตอร์ Colossus ของ xAI เป็นระบบฝึกอบรม AI ที่ใหญ่ที่สุดและทรงพลังที่สุดในโลก โดยสร้างขึ้นภายในเวลาเพียง 122 วัน ซึ่งเร็วกว่าที่ใครๆ คาดไว้ โดยในช่วงแรกนั้นทำงานบน GPU Nvidia H100 จำนวน 100,000 ตัว

ระยะเวลาก่อสร้าง – 122 วัน

ภายในเวลา 92 วัน xAI เพิ่มความจุเป็นสองเท่าเป็น 200,000 GPU ด้วยการผสานชิป Blackwell H200 รุ่นใหม่ที่ทรงพลังกว่าของ Nvidia การเพิ่มพลังอย่างมหาศาลนี้เป็นเพียงจุดเริ่มต้นเท่านั้น xAI วางแผนที่จะขยาย Colossus เป็นชิป 1 ล้านชิป เพื่อปูทางไปสู่โมเดล Grok ในอนาคตที่จะทรงพลังและก้าวล้ำยิ่งกว่าเดิม Grok รุ่นต่อๆ ไปในอนาคตอาจสามารถจัดการวิดีโอ เสียง และข้อมูลสตรีมแบบเรียลไทม์ได้

เมื่อเทคโนโลยีเหล่านี้พัฒนาขึ้น เทคโนโลยีเหล่านี้ก็มีศักยภาพที่จะเปลี่ยนแปลงอุตสาหกรรม ปรับปรุงการเรียนรู้ และขยายความรู้ร่วมกันของเราในรูปแบบที่เราเพิ่งจะเริ่มเข้าใจ การเดินทางของ Grok จากแชทบอทที่ใช้ข้อความไปสู่เอนทิตีแบบโต้ตอบหลายโหมดแบบเรียลไทม์เป็นเครื่องพิสูจน์ถึงความก้าวหน้าอย่างรวดเร็วของนวัตกรรม AI ซึ่งสัญญาว่าจะเป็นช่วงเวลาที่น่าตื่นเต้นสำหรับผู้ใช้ นักพัฒนา และชุมชนเทคโนโลยีโดยรวม

คาดว่า Grok 4 จะเปิดตัวภายในสิ้นปี 2025