Grok: Elon Muskin ”maksimaalinen totuudenetsintä” -chatbot

Grok on generatiivinen tekoälypohjainen chatbot, jonka on kehittänyt Elon Muskin perustama tutkimusyritys xAI. Muiden suosittujen chatbottien tavoin Grok voi tuottaa tekstiä tai koodia, analysoida dataa ja ratkaista monimutkaisia ongelmia. Grok erottuu kuitenkin muista huumorintajullaan ja omaperäisellä ajattelutavallaan. Tässä artikkelissa tutustumme chatbotin historiaan, ominaisuuksiin ja erityispiirteisiin.

Grok:n historia

Elon Musk oli mukana perustamassa OpenAI:ta (tunnetaan ChatGPT:stä) vuonna 2015, mutta lähti yrityksestä kolme vuotta myöhemmin, koska hän ”ei ollut samaa mieltä joidenkin OpenAI-tiimin tavoitteiden kanssa”.

Huhtikuussa 2023 Elon Musk sanoi haastattelussa, että ChatGPT oli liian poliittisesti korrektia, kun taas hän halusi luoda ”mahdollisimman totuudenmukaisen tekoälyn, joka yrittää ymmärtää universumin luonnetta”. Tämän projektin väliaikainen nimi oli TruthGPT (johdettu englannin sanasta ”truth”, totuus).

Elon Musk esittelee TruthGPT:n

He muuttivat nimen lopulta Grokiksi, joka oli inspiroitu Robert A. Heinleinin vuonna 1961 julkaisemasta tieteiskirjasta Stranger in a Strange Land, jossa termi ”grok” tarkoittaa jotain syvällistä ja intuitiivista ymmärrystä.

Grok-ohjelman ensimmäinen versio julkaistiin marraskuussa 2023.
Maaliskuussa 2024 se päivitettiin Grok-1.5:ksi, joka sisälsi edistyksellisiä loogisia ominaisuuksia ja suuremman 128 000 merkin kontekstin.
Joulukuussa 2024 julkaistiin Grok-2. Tämä malli pystyi käsittelemään sekä tekstiä että kuvia.
Lopulta Grok 3 julkaistiin helmikuussa 2025. Elon Musk kutsui tätä mallia ”pelottavan älykkääksi”.

Uusi versio on koulutettu Colossus-supertietokoneella, jonka laskentateho on kymmenkertainen aiempiin huippumalleihin verrattuna.

Grok:n suorituskyky

Elon Musk sanoo, että Grok 3 on maapallon älykkäin tekoäly. Onko se todella niin hyvä kuin mainostetaan? Katsotaanpa:

Grok 3:n tarkkuus on 20 % parempi kuin edeltäjänsä, mikä on vahvistettu alan standardien mukaisilla NLP- ja AI-vertailutesteillä.
25 % nopeampi käsittelynopeus ja 15 % suurempi tarkkuus luonnollisen kielen ymmärtämisessä ja vastausten tuottamisessa verrattuna ChatGPT o1 pro ja DeepSeek R1.
Vaikuttavat tulokset matematiikan, luonnontieteiden ja koodaamisen vertailuissa.

Matematiikka, luonnontieteet, ohjelmointi

Lisää vertailukohtia:

matematiikka, luonnontieteet, koodaus, multimodaalinen ymmärtäminen

Kuten yllä olevista kuvista voidaan nähdä, Grok 3 on erittäin hyvä seuraavissa:

matematiikka (AIME'25 ja AIME'24)
luonnontieteet, kuten biologia, fysiikka ja kemia (GPQA)
koodaus (LCB)
monimodaalinen ymmärtäminen (MMMU)

Pelkästään MMMU-vertailuarvo sisältää 11 500 kysymystä, jotka kattavat eri tieteenalat, kuten taide ja muotoilu, liiketalous, terveys ja lääketiede, luonnontieteet, humanistiset ja yhteiskuntatieteet sekä tekniikka ja insinööritieteet.

MMMU-esimerkki

Grok-3:n varhainen versio (koodinimeltään ”Chocolate”) varmisti ykkössijan LMSYS Arenalla (alusta, joka on suunniteltu eri suurten kielimallien arviointiin ja vertailuun kilpailuympäristössä), jolloin se oli ensimmäinen tekoälymalli, joka ylitti 1400 pisteen rajan kaikissa kategorioissa.

Grok:n nykyiset mallit

Grok 3 on saatavana eri muodoissa ja kokoina. Lippulaivamalli on nimeltään yksinkertaisesti Grok 3. Se hallitsee syvällisesti rahoitus-, terveydenhuolto-, laki- ja tiedealat. Kevyt malli on nimeltään Grok 3 mini. Se on nopea, älykäs ja erinomainen loogisiin tehtäviin, jotka eivät vaadi syvällistä alan tuntemusta.

Lisäksi on olemassa nopeita versioita (grok-3-fast-beta ja grok-3-mini-beta), jotka käyttävät täsmälleen samaa perusmallia ja tarjoavat identtisen vastauslaadun, mutta ne toimivat nopeammalla infrastruktuurilla, mikä lyhentää vastausaikoja merkittävästi.

Tekniset tiedot
Käsittelynopeus	1,5 petaflopsia
Parametrit	2,7 biljoonaa
Koulutustokeneet	12,8 biljoonaa
Vasteviive	67 millisekuntia (keskimäärin)
Konteksti-ikkuna	131072 tokeneita

Grok voi analysoida kuvia (kuvata kuvia, tunnistaa esineitä, lukea tekstiä):

Kuvan enimmäiskoko: 10 MiB
Kuvien enimmäismäärä: Ei rajoitusta
Tuetut kuvatiedostotyypit: jpg, jpeg, png
Mikä tahansa kuvan/tekstin syöttöjärjestys hyväksytään

Grok pystyy myös tuottamaan korkealaatuisia kuvia käyttämällä autoregressiivista kuvanmuodostusmallia, jonka koodinimi on Aurora. Tämä malli tukee natiivisti multimodaalista syöttöä, joten se voi hakea inspiraatiota käyttäjän toimittamista kuvista tai muokata niitä suoraan. Huomaa, että Aurora on saatavilla X-alustalla, mutta se ei välttämättä ole saatavilla muilla alustoilla.

Virallisessa API:ssa olevat Grok-mallit eivät ole yhteydessä internetiin, joten ne eivät ole tietoisia 17. marraskuuta 2024 jälkeen tapahtuneista maailman tapahtumista.

Grok:n koulutus

Grok 3:n kehitystä vauhditti xAI:n Colossus-supertietokone, joka toimii 200 000 Nvidia H100- ja H200-grafiikkaprosessorilla. Uusi malli sai 200 miljoonaa GPU-tuntia koulutusta – 10 kertaa enemmän kuin Grok-2. Tämän valtavan laskentatehon ansiosta Grok 3 voi käsitellä valtavia tietojoukkoja ennennäkemättömällä tehokkuudella ja saavuttaa entistä suuremman tarkkuuden.

Kehittäjät muokkasivat koulutustapaa sisällyttämällä siihen synteettisiä tietokantoja, itsensä korjaavia mekanismeja ja vahvistavaa oppimista Grok 3:n suorituskyvyn parantamiseksi:

Synteettiset tietokannat. Nämä ovat keinotekoisesti luotuja tietoja, jotka on luotu jäljittelemään todellisia tietoja käyttämättä arkaluonteisia tai luottamuksellisia tietoja. Niitä käytetään kielimallien kouluttamiseen simuloimalla erilaisia skenaarioita, mikä takaa monipuolisen ja hallitun tietokannan, joka parantaa oppimisen tehokkuutta ja vastaa tietosuojaan liittyviin huolenaiheisiin.
Itsekorjausmekanismit. Grok-3:ssa on sisäänrakennettu kyky tarkistaa faktat ja tarkentaa omia vastauksiaan ajan myötä. Järjestelmä vertaa vastauksiaan luotettaviin lähteisiin, havaitsee virheet ja muokkaa lähestymistapaansa seuraavaa kertaa varten. Tämä jatkuva itsensä parantaminen tarkoittaa, että mitä enemmän järjestelmää käytetään, sitä vähemmän se tekee virheitä ja vastaukset lähestyvät vähitellen ihmisen vastausten tarkkuutta. Järjestelmä ei ole virheetön, mutta se on suunniteltu oppimaan jokaisesta vuorovaikutuksesta.
Vahvistava oppiminen. Koneoppimisen tyyppi, jossa tekoälymalli oppii saamalla palkkioita tai rangaistuksia toimistaan, aivan kuten ihmiset oppivat taitoja kokemuksen kautta. Järjestelmä on koulutettu maksimoimaan positiiviset tulokset kokeilemalla ja erehtymällä, mikä parantaa sen päätöksentekokykyä.

Nämä tekniikat auttavat vähentämään virheellisiä vastauksia, joita kutsutaan hallusinaatioiksi, käyttämällä useita vahvistusvaiheita ja sopeutumaan tehokkaammin jatkuvan itsearvioinnin ja oppimisen kautta.

Jotta Grokin vastaukset olisivat luonnollisempia ja osuvampia, kehittäjät ottivat käyttöön ihmisten palautesilmukat (koulutusmenetelmä, jossa ihmiset arvioivat keinotekoisesti luodun sisällön tarkkuuden, osuvuuden ja hyödyllisyyden) ja kontekstuaalisen koulutuksen (joka opettaa botille ottamaan huomioon aiemmat vuorovaikutukset, käyttäjän aikomukset ja ympäröivän tiedon, jotta se voi tuottaa tarkempia ja osuvampia vastauksia).

Grok:n ainutlaatuiset piirteet

Useimmat tekoälymallit pitäytyvät muodollisessa sävyissä (ja tuntuvat usein robottimaisilta), mutta Grok 3 erottuu rohkealla ja ironisella tyylillään. Se ei pelkää käyttää huumoria, sarkasmia ja epätavallisia sanontoja. Grok priorisoi tosiasioihin perustuvia, puolueettomia vastauksia ja haastaa usein yleisiä käsityksiä. Kun muut neuroverkot välttävät keskustelemasta monimutkaisista aiheista, Grok ottaa toisenlaisen lähestymistavan. Se ei pelkää keskustella filosofiasta, politiikasta tai eettisistä dilemmoista. Grok osaa ottaa huomioon useita näkökulmia ja jopa myöntää, kun se on epävarma – tämä rehellisyys on harvinaista chatboteissa. Tämän ansiosta Grok tuntuu keskustelukumppanilta eikä yleiskäyttöiseltä vastauskoneelta.

Grok 3 on hyödyllinen viljelijöille, liikemiehille, kuljettajille ja sisällöntuottajille.

Grok on kehitetty tarjoamaan mahdollisimman hyödyllisiä ja totuudenmukaisia vastauksia. Botti loistaa monimutkaisten tai avoimien kysymysten käsittelyssä. Monet chatbotit ovat erinomaisia nopeiden faktojen tai ennalta kirjoitettujen vastausten antamisessa, mutta Grok on suunniteltu vastaamaan monimutkaisiin kysymyksiin, erityisesti tieteen ja kriittisen ajattelun aloilla. Se osaa jakaa monimutkaiset aiheet, kuten kvanttimekaniikan tai eettiset dilemmat, helposti ymmärrettäviksi selityksiksi niitä yksinkertaistamatta. Tämä tekee siitä ensisijaisen valinnan käyttäjille, jotka haluavat enemmän kuin pinnallisia vastauksia, olivatpa he sitten opiskelijoita, tutkijoita tai uteliaita mieliä.

Käyttäjät ovat myös huomanneet, että tämä bot sensuroi vastauksiaan huomattavasti vähemmän kuin ChatGPT tai Claude. Grokilla on kuitenkin turvallisuusprotokollat, jotka estävät haitallisten tai laittomien ohjeiden antamisen, kuten pommin rakentamisen. Jos kysyisit sitä, botti kiertäisi kysymyksen – ehkä selittäen räjähteiden fysiikkaa yleisellä, ei-ohjeellisella tavalla tai sanomalla: ”Ei räjäytetä mitään; tutkitaanpa jotain vähemmän... palavaa?” Tämä tasapainottaa avoimuuden ja vastuullisuuden, toisin kuin jotkut chatbotit, jotka saattavat lopettaa keskustelun kokonaan tai antaa liian epämääräisiä vastauksia.

Grok:n tulevaisuus

Elon Musk mainitsi livestreamissa, että Grok 3 sisältää pian äänitilan, jossa käyttäjät voivat keskustella Grok-chatbotin kanssa äänikomennoilla ja saada tekoälyn tuottamia äänivastauksia. Äänitilan käyttöönoton myötä Grok 3:ssa käyttäjät voivat kokea luonnollisemman ja interaktiivisemman tavan olla vuorovaikutuksessa tekoälyn kanssa, mikä hämärtää ihmisen ja koneen välisen viestinnän rajat.

Premium-ominaisuudet, kuten DeepSearch, Think-tila ja Big Brain -tila, tulevat saataville laajemmalle yleisölle. DeepSearch on Grokin hakukone. Se on suunniteltu hakemaan uusimmat reaaliaikaiset uutiset, syntetisoimaan keskeiset tiedot, päättelemään ristiriitaisista faktoista ja mielipiteistä sekä selkeyttämään monimutkaisia asioita. Think-tila tarjoaa ketjuttavan ajattelutavan käyttäjän kysymykseen. Tuloksena on yksityiskohtainen kuvaus mallin päättelystä vaihe vaiheelta. Se sopii monimutkaisiin kysymyksiin, jotka vaativat huolellista logiikkaa, kuten matematiikan ongelmiin, filosofisiin kysymyksiin tai teknisiin selityksiin. Big Brain -tila on laajempi, luovempi tai laskennallisesti intensiivisempi tila, joka hyödyntää laajempaa kontekstia, edistynyttä kuviontunnistusta tai suurempaa tietopohjaa. Se on ihanteellinen monipuolisten tai avoimien kysymysten ratkaisemiseen, innovatiivisten ideoiden tuottamiseen tai eri alojen välisten yhteyksien löytämiseen. Tämä tila voi simuloida korkeampaa abstraktiotasoa tai intuitiota.

Laitteiston osalta xAI:n Colossus-supertietokone on maailman suurin ja tehokkain tekoälyn koulutusjärjestelmä. Se rakennettiin vain 122 päivässä – nopeammin kuin kukaan ennusti – ja se toimi aluksi 100 000 Nvidia H100 GPU:lla.

Rakennusaika – 122 päivää

Vaikuttavassa 92 päivässä xAI kaksinkertaisti kapasiteettinsa 200 000 GPU:hun integroimalla Nvidian uudet ja tehokkaammat Blackwell H200 -sirut. Tämä valtava tehonlisäys on vasta alkua. xAI aikoo laajentaa Colossuksen miljoonaan siruun, mikä tasoittaa tietä tuleville Grok-malleille, jotka ovat vieläkin tehokkaampia ja mullistavampia. Grok-mallin tulevat versiot saattavat pystyä käsittelemään video-, ääni- ja reaaliaikaisia datavirtoja.

Näiden teknologioiden kehittyessä niillä on potentiaalia muuttaa toimialoja, parantaa oppimista ja laajentaa kollektiivista tietämystämme tavoilla, joita olemme vasta alkamassa ymmärtää. Grokin matka tekstipohjaisesta chatbotista multimodaaliseksi, reaaliaikaisesti vuorovaikutteiseksi kokonaisuudeksi on osoitus tekoälyn innovaatioiden nopeasta tahdista ja lupaa jännittäviä aikoja käyttäjille, kehittäjille ja koko teknologia-yhteisölle.

Grok 4:n odotetaan julkaistavan vuoden 2025 loppuun mennessä.