Grok: Elon Musks «maksimale sannhetssøkende» chatbot
Grok er en generativ kunstig intelligens-chatbot utviklet av xAI, forskningsselskapet grunnlagt av Elon Musk. I likhet med andre populære chatboter kan Grok generere tekst eller kode, analysere data og løse komplekse problemer. Det som skiller Grok fra andre chatboter er imidlertid dens sans for humor og evne til å tenke utenfor boksen. I denne artikkelen skal vi utforske chatbotens historie, funksjoner og fremtredende egenskaper.
Grok sin historie
Elon Musk var med på å grunnlegge OpenAI (kjent for ChatGPT) i 2015, men forlot selskapet tre år senere fordi han «ikke var enig i noen av tingene OpenAI-teamet ønsket å gjøre».
I april 2023 sa Elon Musk i et intervju at ChatGPT var for politisk korrekt, mens han hadde til hensikt å skape «en KI som søker maksimal sannhet og prøver å forstå universets natur». Det foreløpige navnet på dette prosjektet var TruthGPT (avledet av det engelske ordet «truth»).

Elon Musk introduserer TruthGPT
De endret til slutt navnet til Grok, som var inspirert av Robert A. Heinleins science fiction-roman «Stranger in a Strange Land» fra 1961, hvor begrepet «grok» betyr å forstå noe dypt og intuitivt.
- Den første versjonen av Grok ble lansert i november 2023.
- I mars 2024 ble den oppgradert til Grok-1.5, med banebrytende logiske evner og et større kontekstvindu på 128 000 tokens.
- I desember 2024 ble Grok-2 lansert. Denne modellen kunne behandle både tekst og bilder.
- Til slutt ble Grok 3 lansert i februar 2025. Elon Musk kalte denne modellen «skremmende smart».
Denne nye versjonen ble trent på superdatamaskinen Colossus med 10 ganger så stor datakraft som tidligere toppmoderne modeller.
Grok's ytelse
Elon Musk sier at Grok 3 er den smarteste AI på jorden. Er den virkelig så god som den blir fremstilt? La oss se:
- Grok 3 viser 20 % høyere nøyaktighet sammenlignet med forgjengeren, verifisert gjennom bransjestandard NLP- og KI-referansetester.
- 25 % raskere behandlingshastighet og 15 % høyere nøyaktighet i forståelse av naturlig språk og generering av svar sammenlignet med ChatGPT o1 pro og DeepSeek R1.
- Imponerende resultater i referansetester for matematikk, naturfag og koding.

Matematikk, naturfag, programmering
Flere referanseverdier:

Som vi kan se på bildene ovenfor, er Grok 3 ekstremt god på:
- matematikk (AIME'25 og AIME'24)
- naturvitenskap, som biologi, fysikk og kjemi (GPQA)
- koding (LCB)
- multimodal forståelse (MMMU)
MMMU-referanseindeksen alene inneholder 11 500 spørsmål som dekker fagområder på tvers av disipliner, inkludert kunst og design, økonomi, helse og medisin, naturvitenskap, humaniora og samfunnsvitenskap, samt teknologi og ingeniørfag.

MMMU eksempel
Den tidlige versjonen av Grok-3 (kodenavn «Chocolate») sikret seg førsteplassen i LMSYS Arena (en plattform utviklet for å evaluere og sammenligne ulike store språkmodeller i et konkurransepreget miljø), og ble dermed den første KI-modellen som overgikk 1400 poeng i alle kategorier.

Grok sine nåværende modeller
Grok 3 kommer i forskjellige former og størrelser. Flaggskeppsmodellen heter ganske enkelt Grok 3. Den har dyp domenekunnskap innen finans, helsevesen, jus og vitenskap. En lettvektsmodell heter Grok 3 mini. Den er rask, smart og ypperlig for logikkbaserte oppgaver som ikke krever dyp domenekunnskap.
Det finnes også raske varianter (grok-3-fast-beta og grok-3-mini-beta) som bruker nøyaktig samme underliggende modell og leverer identisk responskvalitet, men de leveres på en raskere infrastruktur, noe som resulterer i betydelig raskere responstider.
Tekniske spesifikasjoner | |
| Behandlingshastighet | 1,5 petaflops |
| Parametere | 2,7 billioner |
| Opplæringstokener | 12,8 billioner |
| Responsforsinkelse | 67 millisekunder (i gjennomsnitt) |
| Kontekstvindu | 131072 tokens |
Grok kan analysere bilder (beskrive bilder, identifisere objekter, lese tekst):
- Maksimal bildestørrelse: 10 MiB
- Maksimalt antall bilder: Ingen begrensning
- Støttede bildefiltyper: jpg, jpeg, png
- Alle bilder/tekst kan legges inn i hvilken som helst rekkefølge
Grok kan også generere bilder av høy kvalitet ved hjelp av sin autoregressive bildegenereringsmodell, med kodenavnet Aurora. Denne modellen har innebygd støtte for multimodal inndata, slik at den kan hente inspirasjon fra eller direkte redigere bilder som brukeren har levert. Vær oppmerksom på at Aurora er tilgjengelig på X-plattformen, men ikke nødvendigvis på andre plattformer.
Grok-modeller på den offisielle API-en er ikke koblet til internett, noe som betyr at de ikke har kunnskap om verdenshendelser etter 17. november 2024.
Grok-opplæring
Utviklingen av Grok 3 ble kraftig forbedret av xAI-superdatamaskinen Colossus, som kjører på 200 000 Nvidia H100- og H200-GPU-er. Den nye modellen fikk 200 millioner GPU-timer med opplæring – ti ganger mer enn Grok-2. Takket være dette enorme spranget i datakraft kan Grok 3 behandle enorme datasett med enestående effektivitet, samtidig som den oppnår enda større nøyaktighet.
Utviklerne justerte treningsmetoden ved å innlemme syntetiske datasett, selvkorrigeringsmekanismer og forsterkende læring for å forbedre Grok 3s ytelse:
- Syntetiske datasett. Dette er kunstig genererte data som er laget for å etterligne data fra den virkelige verden uten å bruke sensitiv eller proprietær informasjon. De brukes til å trene språkmodeller ved å simulere ulike scenarier, noe som sikrer et mangfoldig og kontrollert datasett som øker læringseffektiviteten og ivaretar personvernet.
- Selvkorrigerende mekanismer. Grok-3 har en innebygd evne til å faktasjekke og forbedre sine egne svar over tid. Systemet sammenligner svarene sine med pålitelige kilder, finner feil og justerer tilnærmingen for neste gang. Denne kontinuerlige selvforbedringen betyr at jo mer du bruker det, jo færre feil gjør det, og gradvis nærmer det seg menneskelig nøyaktighet i svarene. Det er ikke feilfritt, men det er designet for å lære av hver interaksjon.
- Forsterkende læring. En type maskinlæring hvor en KI-modell lærer ved å motta belønninger eller straff for sine handlinger, på samme måte som mennesker tilegner seg ferdigheter gjennom erfaring. Systemet er trent til å maksimere positive resultater gjennom prøving og feiling, og forbedrer dermed sine beslutningsferdigheter.
Disse teknikkene bidrar til å redusere feilaktige svar, kjent som hallusinasjoner, ved å bruke flere valideringstrinn, og tilpasse seg mer effektivt gjennom kontinuerlig selvvurdering og læring.
For å gjøre Groks svar mer naturlige og relevante, introduserte utviklerne menneskelige tilbakemeldingssløyfer (en treningsmetode hvor mennesker vurderer nøyaktigheten, relevansen og nytten av kunstig generert innhold) og kontekstuell trening (det lærer boten å ta hensyn til tidligere interaksjoner, brukerens intensjon og informasjon fra omgivelsene for å generere mer nøyaktige og relevante svar).
Grok sine unike egenskaper
Mens de fleste KI-modeller holder seg til en formell tone (og ofte føles robotaktige), skiller Grok 3 seg ut med sin dristige og ironiske stil. Den er ikke redd for å bruke humor, sarkasme og ukonvensjonelle formuleringer. Grok prioriterer faktiske, upartiske svar og utfordrer ofte populære narrativer. Mens andre nevrale nettverk unngår å diskutere komplekse emner, tar Grok en annen tilnærming. Den er ikke redd for å diskutere filosofi, politikk eller etiske dilemmaer. Grok kan vurdere flere synspunkter og til og med innrømme når den er usikker – en ærlighet som er sjelden blant chatbots. Dette gjør at Grok føles som en samtalepartner snarere enn en generisk svarmaskin.

Grok 3 er nyttig for bønder, forretningsfolk, sjåfører og innholdsprodusenter.
Grok er utviklet med en misjon om å gi mest mulig nyttige og sannferdige svar. Boten utmerker seg når den håndterer komplekse eller åpne spørsmål. Mens mange chatboter er gode på raske fakta eller forhåndsskrevne svar, er Grok designet for å håndtere nyanserte spørsmål, spesielt innen områder som vitenskap og kritisk tenkning. Den kan bryte ned kompliserte emner – som kvantemekanikk eller etiske dilemmaer – til forståelige forklaringer uten å forenkle dem. Dette gjør den til et førstevalg for brukere som ønsker mer enn overfladiske svar, enten de er studenter, forskere eller nysgjerrige sjeler.
Brukere bemerker også at denne boten sensurerer svarene sine langt mindre enn ChatGPT eller Claude. Grok har imidlertid sikkerhetsprotokoller for å forhindre skadelige eller ulovlige instruksjoner, som å lage en bombe. Hvis du spurte om dette, ville boten avlede spørsmålet – kanskje ved å forklare vitenskapen bak eksplosiver på en generell, ikke-instruerende måte eller si: «La oss ikke sprenge ting i lufta; hva med å utforske noe mindre... brennbart?» Dette balanserer åpenhet med ansvar, i motsetning til noen chatboter som kan avslutte samtalen helt eller gi altfor vage svar.
Grok's fremtid
Elon Musk nevnte i en livestream at Grok 3 snart vil inkludere en stemmemodus, hvor brukere vil kunne kommunisere med Grok-chatboten gjennom talekommandoer og motta KI-genererte stemmesvar. Med introduksjonen av stemmemodus i Grok 3 vil brukerne oppleve en mer naturlig og interaktiv måte å kommunisere med KI på, noe som vil viske ut grensene mellom menneskelig og maskinell kommunikasjon.
Premiumfunksjoner, som DeepSearch, Think-modus og Big Brain-modus, vil bli tilgjengelige for et bredere publikum. DeepSearch er Groks søkemotor. Den er designet for å gi tilgang til de siste nyhetene i sanntid, syntetisere nøkkelinformasjon, resonnere om motstridende fakta og meninger og skape klarhet i komplekse situasjoner. Think-modus gir en tankerekke-tilnærming til brukerens spørsmål. Resultatet er en trinnvis detaljering av modellens resonnement. Den er egnet for komplekse spørsmål som krever nøye logikk, som matematiske problemer, filosofiske spørsmål eller tekniske forklaringer. Big Brain-modus er en mer omfattende, kreativ eller beregningsintensiv modus som utnytter bredere kontekst, avansert mønstergjenkjenning eller en større kunnskapsbase. Den er ideell for å takle mangesidige eller åpne spørsmål, generere innovative ideer eller koble sammen punkter på tvers av ulike domener. Denne modusen kan simulere et høyere nivå av abstraksjon eller intuisjon.
Når det gjelder maskinvaren, er xAI's Colossus superdatamaskin verdens største og kraftigste KI-treningssystem. Den ble bygget på bare 122 dager – raskere enn noen hadde forutsett – og kjørte opprinnelig på 100 000 Nvidia H100 GPU-er.

Byggetid – 122 dager
På imponerende 92 dager doblet xAI kapasiteten til 200 000 GPU-er ved å integrere Nvidias nye og kraftigere Blackwell H200-brikker. Denne enorme økningen i kraft er bare begynnelsen. xAI planlegger å skalere Colossus til 1 million brikker, og baner dermed vei for fremtidige Grok-modeller som vil være enda kraftigere og banebrytende. Fremtidige versjoner av Grok kan være i stand til å håndtere video, lyd og sanntids datastrømmer.
Etter hvert som disse teknologiene utvikler seg, har de potensial til å transformere bransjer, forbedre læring og utvide vår kollektive kunnskap på måter vi bare begynner å forstå. Groks reise fra en tekstbasert chatbot til en multimodal, interaktiv enhet i sanntid er et bevis på den raske utviklingen innen KI-innovasjon, og lover spennende tider for brukere, utviklere og teknologimiljøet generelt.
Grok 4 forventes å bli lansert innen utgangen av 2025.