Grok: Elon Musks chatbot die ‘maximaal naar de waarheid zoekt’

Grok is een generatieve kunstmatige intelligentie chatbot ontwikkeld door xAI, het onderzoeksbedrijf opgericht door Elon Musk. Net als andere populaire chatbots kan Grok tekst of code genereren, gegevens analyseren en complexe problemen oplossen. Wat Grok echter onderscheidt, is zijn gevoel voor humor en out-of-the-box denken. In dit artikel gaan we in op de geschiedenis, mogelijkheden en opvallende kenmerken van de chatbot.

De geschiedenis van Grok

Elon Musk was in 2015 medeoprichter van OpenAI (bekend van ChatGPT), maar verliet het bedrijf drie jaar later omdat hij “het niet eens was met een aantal dingen die het OpenAI-team wilde doen”.

In april 2023 zei Elon Musk in een interview dat ChatGPT te politiek correct was, terwijl hij van plan was “een AI te creëren die zo veel mogelijk naar de waarheid streeft en de aard van het universum probeert te begrijpen”. De voorlopige naam voor dit project was TruthGPT (afgeleid van het Engelse woord ‘truth’, waarheid).

Elon Musk introduceert TruthGPT

Uiteindelijk hebben ze de naam veranderd in Grok, geïnspireerd door Robert A. Heinleins sciencefictionroman ‘Stranger in a Strange Land’ uit 1961, waarin de term ‘grok’ staat voor iets diepgaand en intuïtief begrijpen.

De eerste versie van Grok werd uitgebracht in november 2023.
In maart 2024 werd het geüpgraded naar Grok-1.5, met geavanceerde logische mogelijkheden en een groter contextvenster van 128.000 tokens.
In december 2024 werd Grok-2 uitgebracht. Dit model kon zowel tekst als afbeeldingen verwerken.

Ten slotte werd Grok 3 uitgebracht in februari 2025. Elon Musk noemde dit model “eng slim”.

Deze nieuwe versie is getraind op de Colossus-supercomputer met 10 keer de rekenkracht van eerdere state-of-the-art modellen.

De prestaties van Grok

Elon Musk zegt dat Grok 3 de slimste AI op aarde is. Is het echt zo goed als wordt beweerd? Laten we eens kijken:

Grok 3 is 20% nauwkeuriger dan zijn voorganger, wat is geverifieerd door middel van industriestandaard NLP- en AI-benchmarks.
25% snellere verwerkingssnelheden en 15% grotere nauwkeurigheid in het begrijpen van natuurlijke taal en het genereren van reacties in vergelijking met ChatGPT o1 pro en DeepSeek R1.
Indrukwekkende resultaten in benchmarks voor wiskunde, wetenschap en codering.

Wiskunde, wetenschappen, programmeren

Meer benchmarks:

wiskunde, natuurwetenschappen, programmeren, multimodaal begrip

Zoals we op de bovenstaande afbeeldingen kunnen zien, blinkt Grok 3 uit in:

wiskunde (AIME'25 en AIME'24)
natuurwetenschappen, zoals biologie, natuurkunde en scheikunde (GPQA)
coderen (LCB)
multimodaal begrip (MMMU)

De MMMU-benchmark alleen al omvat 11.500 vragen over onderwerpen uit verschillende disciplines, waaronder kunst en design, bedrijfskunde, gezondheid en geneeskunde, wetenschappen, geesteswetenschappen en sociale wetenschappen, en technologie en engineering.

MMMU-voorbeeld

De vroege versie van Grok-3 (codenaam “Chocolate”) behaalde de eerste plaats in LMSYS Arena (een platform voor het evalueren en vergelijken van verschillende grote taalmodellen in een competitieve omgeving) en werd daarmee het eerste AI-model dat in alle categorieën een score van meer dan 1400 behaalde.

De huidige modellen van Grok

Grok 3 is verkrijgbaar in verschillende vormen en maten. Het vlaggenschipmodel heet simpelweg Grok 3. Het beschikt over diepgaande domeinkennis op het gebied van financiën, gezondheidszorg, recht en wetenschap. Een lichtgewicht model heet Grok 3 mini. Het is snel, slim en zeer geschikt voor logische taken waarvoor geen diepgaande domeinkennis vereist is.

Er zijn ook snelle varianten (grok-3-fast-beta en grok-3-mini-beta) die exact hetzelfde onderliggende model gebruiken en dezelfde responskwaliteit leveren, maar ze worden aangeboden op een snellere infrastructuur, wat resulteert in aanzienlijk snellere responstijden.

Technische specificaties
Verwerkingssnelheid	1,5 petaflops
Parameters	2,7 biljoen
Trainingstokens	12,8 biljoen
Reactietijd	67 milliseconden (gemiddeld)
Contextvenster	131072 tokens

Grok kan afbeeldingen analyseren (afbeeldingen beschrijven, objecten identificeren, tekst lezen):

Maximale afbeeldingsgrootte: 10 MiB
Maximaal aantal afbeeldingen: geen limiet
Ondersteunde afbeeldingsbestandsindelingen: jpg, jpeg, png
Elke volgorde van afbeeldingen/tekst is toegestaan

Grok kan ook hoogwaardige afbeeldingen genereren met behulp van zijn autoregressieve afbeeldingsgeneratiemodel, met de codenaam Aurora. Dit model biedt native ondersteuning voor multimodale invoer, waardoor het inspiratie kan halen uit door gebruikers aangeleverde afbeeldingen of deze rechtstreeks kan bewerken. Houd er rekening mee dat Aurora beschikbaar is op het X-platform, maar mogelijk niet op andere platforms.

Grok-modellen op de officiële API zijn niet verbonden met het internet, wat betekent dat ze geen kennis hebben van de wereldgebeurtenissen na 17 november 2024.

De training van Grok

De ontwikkeling van Grok 3 werd versneld door de Colossus-supercomputer van xAI, die draait op 200.000 Nvidia H100- en H200-GPU's. Het nieuwe model kreeg 200 miljoen GPU-uren training – tien keer meer dan Grok-2. Dankzij deze enorme sprong in rekenkracht kan Grok 3 enorme datasets met ongekende efficiëntie verwerken en tegelijkertijd een nog grotere nauwkeurigheid bereiken.

De ontwikkelaars hebben de trainingsaanpak aangepast door synthetische datasets, zelfcorrigerende mechanismen en reinforcement learning te integreren om de prestaties van Grok 3 te verbeteren:

Synthetische datasets. Dit zijn kunstmatig gegenereerde gegevens die zijn gemaakt om echte gegevens na te bootsen zonder gebruik te maken van gevoelige of vertrouwelijke informatie. Ze worden gebruikt om taalmodellen te trainen door verschillende scenario's te simuleren, waardoor een diverse en gecontroleerde dataset ontstaat die de leerefficiëntie verhoogt en zorgen over gegevensprivacy wegneemt.
Zelfcorrigerende mechanismen. Grok-3 heeft een ingebouwde functie om zijn eigen antwoorden in de loop van de tijd te controleren en te verfijnen. Het systeem vergelijkt zijn antwoorden met betrouwbare bronnen, spoort fouten op en past zijn aanpak voor de volgende keer aan. Deze voortdurende zelfverbetering betekent dat hoe vaker u het gebruikt, hoe minder fouten het maakt, waardoor het geleidelijk aan de nauwkeurigheid van menselijke antwoorden benadert. Het is niet foutloos, maar het is ontworpen om van elke interactie te leren.
Versterkend leren. Een vorm van machine learning waarbij een AI-model leert door beloningen of straffen te krijgen voor zijn acties, net zoals mensen vaardigheden opdoen door ervaring. Het systeem wordt getraind om positieve resultaten te maximaliseren door middel van vallen en opstaan, waardoor zijn besluitvormingsvermogen wordt verbeterd.

Deze technieken helpen onjuiste antwoorden, ook wel hallucinaties genoemd, te verminderen door middel van meerdere validatiestappen, en zorgen voor een effectievere aanpassing door voortdurende zelfevaluatie en leren.

Om de reacties van Grok natuurlijker en relevanter te maken, hebben de ontwikkelaars menselijke feedbackloops geïntroduceerd (een trainingsmethode waarbij mensen de nauwkeurigheid, relevantie en bruikbaarheid van kunstmatig gegenereerde content beoordelen) en contextuele training (hierbij leert de bot rekening te houden met eerdere interacties, de intentie van de gebruiker en omgevingsinformatie om nauwkeurigere en relevantere antwoorden te genereren).

De unieke eigenschappen van Grok

Terwijl de meeste AI-modellen zich aan een formele toon houden (en vaak robotachtig overkomen), onderscheidt Grok 3 zich door zijn gedurfde en ironische stijl. Het schrikt niet terug voor humor, sarcasme en onconventionele bewoordingen. Grok geeft prioriteit aan feitelijke, onbevooroordeelde reacties en daagt vaak populaire verhalen uit. Terwijl andere neurale netwerken complexe onderwerpen vermijden, kiest Grok voor een andere aanpak. Het schuwt filosofische, politieke of ethische dilemma's niet. Grok kan meerdere standpunten in overweging nemen en zelfs toegeven wanneer het iets niet zeker weet – een eerlijkheid die zeldzaam is onder chatbots. Hierdoor voelt Grok meer als een gesprekspartner dan als een generieke antwoordmachine.

Grok 3 is handig voor boeren, zakenmensen, chauffeurs en makers van content

Grok is ontwikkeld met als missie om zo behulpzaam en waarheidsgetrouw mogelijke antwoorden te geven. De bot blinkt uit in het beantwoorden van complexe of open vragen. Terwijl veel chatbots uitblinken in het geven van snelle feiten of vooraf geschreven antwoorden, is Grok ontworpen om genuanceerde vragen te beantwoorden, met name op het gebied van wetenschap en kritisch denken. Het kan ingewikkelde onderwerpen, zoals kwantummechanica of ethische dilemma's, opsplitsen in begrijpelijke uitleg zonder deze te versimpelen. Dit maakt het een ideale keuze voor gebruikers die meer willen dan oppervlakkige antwoorden, of ze nu studenten, onderzoekers of nieuwsgierige geesten zijn.

Gebruikers merken ook op dat deze bot zijn antwoorden veel minder censureert dan ChatGPT of Claude. Grok heeft echter veiligheidsprotocollen om schadelijke of illegale instructies, zoals het bouwen van een bom, te voorkomen. Als je erom zou vragen, zou de bot de vraag afwijzen, bijvoorbeeld door de wetenschap achter explosieven op een algemene, niet-instructieve manier uit te leggen of door te zeggen: “Laten we geen dingen opblazen; laten we iets minder... brandbaars onderzoeken.” Dit zorgt voor een evenwicht tussen openheid en verantwoordelijkheid, in tegenstelling tot sommige chatbots die het gesprek volledig zouden beëindigen of overdreven vage antwoorden zouden geven.

De toekomst van Grok

Elon Musk heeft in een livestream vermeld dat Grok 3 binnenkort een spraakmodus zal krijgen, waarmee gebruikers via gesproken commando's met de Grok-chatbot kunnen converseren en door AI gegenereerde gesproken antwoorden kunnen ontvangen. Met de introductie van de spraakmodus in Grok 3 zullen gebruikers een meer natuurlijke en interactieve manier ervaren om met AI te communiceren, waardoor de grenzen tussen menselijke en machinecommunicatie vervagen.

Premiumfuncties, zoals DeepSearch, Think-modus en Big Brain-modus, zullen beschikbaar worden voor een breder publiek. DeepSearch is de zoekmachine van Grok. Deze is ontworpen om toegang te krijgen tot het laatste nieuws in realtime, belangrijke informatie te synthetiseren, tegenstrijdige feiten en meningen te beredeneren en duidelijkheid te scheppen in complexe situaties. Think-modus biedt een gedachtegangbenadering van de vraag van een gebruiker. De output is een stapsgewijze uitleg van de redenering van het model. Deze modus is geschikt voor complexe vragen die een zorgvuldige logica vereisen, zoals wiskundige problemen, filosofische vragen of technische uitleg. Big Brain-modus is een meer uitgebreide, creatieve of rekenintensieve modus die gebruikmaakt van een bredere context, geavanceerde patroonherkenning of een grotere kennisbank. Deze modus is ideaal voor het beantwoorden van veelzijdige of open vragen, het genereren van innovatieve ideeën of het leggen van verbanden tussen verschillende domeinen. Deze modus kan een hoger niveau van abstractie of intuïtie simuleren.

Wat de hardware betreft, is de Colossus-supercomputer van xAI 's werelds grootste en krachtigste AI-trainingssysteem. Hij werd in slechts 122 dagen gebouwd – sneller dan iedereen had voorspeld – en draaide aanvankelijk op 100.000 Nvidia H100 GPU's.

Bouwtijd – 122 dagen

In een indrukwekkende 92 dagen verdubbelde xAI zijn capaciteit tot 200.000 GPU's door de nieuwe en krachtigere Blackwell H200-chips van Nvidia te integreren. Deze enorme vermogensboost is nog maar het begin. xAI is van plan Colossus uit te breiden tot 1 miljoen chips, waarmee de weg wordt vrijgemaakt voor toekomstige Grok-modellen die nog krachtiger en baanbrekender zullen zijn. Toekomstige versies van Grok zullen mogelijk video, audio en realtime datastromen kunnen verwerken.

Naarmate deze technologieën zich verder ontwikkelen, hebben ze het potentieel om industrieën te transformeren, het leren te verbeteren en onze collectieve kennis uit te breiden op manieren die we nog maar net beginnen te begrijpen. De reis van Grok van een op tekst gebaseerde chatbot naar een multimodale, realtime interactieve entiteit is een bewijs van het hoge tempo van AI-innovatie en belooft spannende tijden voor gebruikers, ontwikkelaars en de tech-gemeenschap in het algemeen.

Grok 4 wordt naar verwachting eind 2025 uitgebracht.