Grok: Elon Muski „maksimaalne tõeotsing“ chatbot

Grok on generatiivne tehisintellekti chatbot, mille on arendanud Elon Muski asutatud uurimisettevõte xAI. Nagu teised populaarsed chatbotid, suudab Grok genereerida teksti või koodi, analüüsida andmeid ja lahendada keerulisi probleeme. Groki eristab aga tema huumorimeel ja väljaspool raame mõtlemine. Selles artiklis uurime chatboti ajalugu, võimekust ja silmapaistvaid omadusi.

Grok'i ajalugu

Elon Musk asutas 2015. aastal OpenAI (tuntud ChatGPT järgi), kuid lahkus ettevõttest 3 aastat hiljem, kuna ta „ei nõustunud mõne OpenAI meeskonna eesmärgiga“.

2023. aasta aprillis ütles Elon Musk intervjuus, et ChatGPT on liiga poliitiliselt korrektne, samas kui tema eesmärk oli luua „maksimaalselt tõde otsiv tehisintellekt, mis püüab mõista universumi olemust“. Selle projekti esialgne nimi oli TruthGPT (tuletatud inglise sõnast „truth“ – tõde).

Elon Musk tutvustab TruthGPT-d

Lõpuks muudeti nimi Grokiks, mis oli inspireeritud Robert A. Heinleini 1961. aasta ulmeromaanist „Stranger in a Strange Land“, kus termin „grok“ tähendab midagi sügavalt ja intuitiivselt mõista.

Grok esimene versioon ilmus 2023. aasta novembris.
2024. aasta märtsis uuendati seda versiooniks Grok-1.5, millel oli uuenduslikud loogilised võimed ja suurem kontekstuaalne aken 128 000 märgiga.
2024. aasta detsembris ilmus Grok-2. See mudel suutis töödelda nii teksti kui ka pilte.

Lõpuks ilmus 2025. aasta veebruaris Grok 3. Elon Musk nimetas seda mudelit „hirmutavalt targaks“.

Uus versioon treeniti Colossus-superarvutis, mille arvutusvõimsus on 10 korda suurem kui varasemate tippmudelite oma.

Grok'i jõudlus

Elon Musk väidab, et Grok 3 on maailma targem tehisintellekt. Kas see on tõesti nii hea, kui reklaamitakse? Vaadakem:

Grok 3 on eelkäijast 20% täpsem, mis on kinnitatud tööstusharu standardite NLP ja AI võrdlusuuringutega.
25% kiirem töötlemiskiirus ja 15% suurem täpsus loomuliku keele mõistmisel ja vastuste genereerimisel võrreldes ChatGPT o1 pro ja DeepSeek R1-ga.
Muljetavaldavad tulemused matemaatika, loodusteaduste ja programmeerimise võrdlusuuringutes.

Matemaatika, loodusteadused, programmeerimine

Rohkem võrdlusnäitajaid:

Nagu näeme ülaltoodud piltidel, on Grok 3 eriti hea järgmistes valdkondades:

matemaatika (AIME'25 ja AIME'24)
loodusteadused, nagu bioloogia, füüsika ja keemia (GPQA)
kodeerimine (LCB)
multimodaalne arusaamine (MMMU)

Ainuüksi MMMU võrdlusalune hõlmab 11 500 küsimust, mis katavad erinevaid valdkondi, sealhulgas kunst ja disain, äri, tervis ja meditsiin, loodusteadused, humanitaar- ja sotsiaalteadused ning tehnoloogia ja inseneriteadused.

MMMU näide

Grok-3 varajane versioon (koodnimega „Chocolate“) saavutas LMSYS Arena (platvorm, mis on loodud erinevate suurte keelemudelite hindamiseks ja võrdlemiseks konkurentsikeskkonnas) esikoha, olles esimene tehisintellekti mudel, mis ületas kõikides kategooriates 1400 punkti piiri.

Grok praegused mudelid

Grok 3 on saadaval erinevates vormides ja suurustes. Lipulaevmudel kannab lihtsalt nime Grok 3. See omab sügavaid valdkonnateadmisi rahanduse, tervishoiu, õiguse ja teaduse valdkonnas. Kergem mudel kannab nime Grok 3 mini. See on kiire, nutikas ja suurepärane loogikal põhinevate ülesannete jaoks, mis ei nõua sügavaid valdkonnateadmisi.

Lisaks on olemas kiired variandid (grok-3-fast-beta ja grok-3-mini-beta), mis kasutavad täpselt sama alusmudelit ja pakuvad identse vastuse kvaliteedi, kuid need töötavad kiiremal infrastruktuuril, mis tagab oluliselt kiirema vastuse.

Tehnilised andmed
Töötlemiskiirus	1,5 petaflopsi
Parameetrid	2,7 triljonit
Koolitustokenid	12,8 triljonit
Vastuse latentsus	67 millisekundit (keskmiselt)
Kontekstaken	131072 tokenid

Grok suudab analüüsida pilte (kirjeldada pilte, tuvastada objekte, lugeda teksti):

Maksimaalne pildi suurus: 10 MiB
Maksimaalne piltide arv: piiramatu
Toetatud pildifailitüübid: jpg, jpeg, png
Iga pildi/teksti sisestamise järjekord on lubatud

Lisaks suudab Grok genereerida kõrgekvaliteedilisi pilte, kasutades oma autoregressiivset pildigenereerimismudelit, koodnimega Aurora. See mudel toetab natiivset multimodaalset sisestust, mis võimaldab tal kasutada inspiratsiooni kasutaja poolt esitatud piltidest või neid otse redigeerida. Palun pange tähele, et Aurora on saadaval X-platvormil, kuid ei pruugi olla saadaval teistel platvormidel.

Ametliku API-liidese Grok-mudelid ei ole ühendatud internetiga, mis tähendab, et neil puudub teave maailmas pärast 17. novembrit 2024 toimunud sündmuste kohta.

Grok'i koolitus

Grok 3 arendamist kiirendas xAI superarvuti Colossus, mis töötab 200 000 Nvidia H100 ja H200 GPU-l. Uus mudel sai 200 miljonit GPU-tundi koolitust – 10 korda rohkem kui Grok-2. Tänu sellele tohutule arvutusvõimsuse hüppele suudab Grok 3 töödelda tohutuid andmekogumeid enneolematu tõhususega, saavutades samal ajal veelgi suurema täpsuse.

Arendajad kohandasid treeningmeetodit, lisades sünteetilised andmekogumid, enesekorrigeerimismehhanismid ja tugevdava õppe, et parandada Grok 3 jõudlust:

Sünteetilised andmekogumid. Need on kunstlikult loodud andmed, mis on loodud reaalse maailma andmete jäljendamiseks, kasutamata tundlikku või konfidentsiaalset teavet. Neid kasutatakse keelemudelite treenimiseks, simuleerides erinevaid stsenaariume, tagades mitmekesise ja kontrollitud andmekogumi, mis suurendab õppimise efektiivsust ja lahendab andmekaitse probleeme.
Isekorrektsioonimehhanismid. Grok-3-l on sisseehitatud võime aja jooksul oma vastuseid kontrollida ja täiustada. Süsteem võrdleb oma vastuseid usaldusväärsete allikatega, leiab vead ja kohandab oma lähenemist järgmiseks korraks. See pidev enesetäiustamine tähendab, et mida rohkem seda kasutate, seda vähem vigu see teeb, lähenedes järk-järgult inimese vastuste täpsusele. See ei ole veatu, kuid on loodud õppima igast suhtlusest.
Tugevdav õppimine. Masinõppe liik, kus tehisintellekti mudel õpib oma tegevuse eest preemiaid või karistusi saades, sarnaselt sellele, kuidas inimesed omandavad oskusi kogemuste kaudu. Süsteem on treenitud maksimeerima positiivseid tulemusi katsetamise ja eksimise kaudu, parandades oma otsustusvõimet.

Need tehnikad aitavad vähendada valesid vastuseid, mida nimetatakse hallutsinatsioonideks, kasutades mitmeid valideerimisetappe, ning kohaneda tõhusamalt pideva enesehindamise ja õppimise kaudu.

Et Groki vastused oleksid loomulikumad ja asjakohasemad, kasutasid arendajad inimeste tagasiside tsükleid (koolitusmeetod, kus inimesed hindavad kunstlikult loodud sisu täpsust, asjakohasust ja kasulikkust) ja kontekstuaalset koolitust (õpetab botti arvestama eelmisi suhtlemisi, kasutaja kavatsusi ja ümbritsevat teavet, et anda täpsemaid ja asjakohasemaid vastuseid).

Grok'i unikaalsed omadused

Kui enamik tehisintellekti mudeleid kasutab formaalset tooni (ja tundub sageli robotlik), siis Grok 3 paistab silma oma julge ja iroonilise stiiliga. Ta ei karda kasutada huumorit, sarkasmi ja ebatavalisi väljendeid. Grok eelistab faktilisi, erapooletuid vastuseid, mis sageli vaidlustavad levinud narratiive. Kui teised neurovõrgustikud väldivad keeruliste teemade arutamist, on Grok teistsugune. Ta ei karda arutada filosoofiat, poliitikat ega eetilisi dilemmasid. Grok suudab arvestada mitmeid seisukohti ja isegi tunnistada, kui ta pole kindel – see ausus on chatbotite seas haruldane. Seetõttu tundub Grok pigem vestluspartnerina kui üldise vastuste masinana.

Grok 3 on abiks põllumajandustootjatele, ettevõtjatele, autojuhtidele ja sisu loojatele

Grok on loodud eesmärgiga anda võimalikult kasulikke ja tõeseid vastuseid. Bot paistab silma keeruliste või avatud küsimuste käsitlemisel. Kuigi paljud chatbotid on head kiirete faktide või skriptitud vastuste andmisel, on Grok loodud keeruliste küsimuste lahendamiseks, eriti sellistes valdkondades nagu teadus ja kriitiline mõtlemine. See suudab keerulised teemad, nagu kvantmehaanika või eetilised dilemmad, lihtsustada, ilma neid liigselt lihtsustamata. See teeb sellest parima valiku kasutajatele, kes soovivad rohkem kui pinnapealseid vastuseid, olgu nad siis õpilased, teadlased või uudishimulikud.

Samuti märgivad kasutajad, et see bot tsenseerib oma vastuseid palju vähem kui ChatGPT või Claude. Grokil on aga ohutusprotokollid, mis takistavad kahjulike või ebaseaduslike juhiste andmist, näiteks pommi valmistamine. Kui kasutaja küsib seda, siis bot kõrvalehoiab, selgitades ehk üldiselt ja mitte juhendavalt lõhkeainete teadust või ütleb: „Ärgem laskem asju õhku, uurime midagi vähem... põlevat?“ See tasakaalustab avatuse ja vastutustunde, erinevalt mõnest chatbotist, mis võivad vestluse täielikult lõpetada või anda liiga ebamääraseid vastuseid.

Grok tulevik

Elon Musk mainis otseülekandes, et Grok 3 hakkab varsti sisaldama häälerežiimi, kus kasutajad saavad Grok-chatbotiga suhelda häälkäskluste abil ja saada tehisintellekti poolt genereeritud häälvastuseid. Häälerežiimi lisamisega Grok 3-sse saavad kasutajad kogeda loomulikumat ja interaktiivsemat viisi tehisintellektiga suhelda, mis hägustab piire inimese ja masina vahelise suhtluse vahel.

Premium-funktsioonid, nagu DeepSearch, Think-režiim ja Big Brain-režiim, muutuvad kättesaadavaks laiemale publikule. DeepSearch on Groki otsingumootor. See on loodud juurdepääsuks viimastele reaalajas uudistele, olulise teabe sünteesimiseks, vastuoluliste faktide ja arvamuste analüüsimiseks ning keerukast selguse loomiseks. Think-režiim pakub kasutaja küsimusele mõttekäigu lähenemist. Väljundiks on mudeli mõttekäigu samm-sammuline kirjeldus. See sobib keerulistele küsimustele, mis nõuavad hoolikat loogikat, nagu matemaatikaülesanded, filosoofilised küsimused või tehnilised selgitused. Big Brain mode on laiem, loovam ja arvutusmahukam režiim, mis kasutab laiemat konteksti, täiustatud mustrite tuvastamist või suuremat teadmistebaasi. See on ideaalne mitmekülgsete või avatud küsimuste lahendamiseks, uuenduslike ideede genereerimiseks või erinevate valdkondade seoste leidmiseks. See režiim võib simuleerida kõrgemal tasemel abstraktsiooni või intuitsiooni.

Riistvara osas on xAI Colossus superarvuti maailma suurim ja võimsaim tehisintellekti koolitussüsteem. See ehitati vaid 122 päevaga – kiiremini kui keegi ennustas – ja töötas algselt 100 000 Nvidia H100 GPU-l.

Ehitusaeg – 122 päeva

Muljetavaldava 92 päeva jooksul kahekordistas xAI oma võimsuse 200 000 GPU-ni, integreerides Nvidia uued ja võimsamad Blackwell H200 kiibid. See tohutu võimsuse kasv on alles algus. xAI plaanib Colossuse võimsust suurendada 1 miljoni kiibini, sillutades teed tulevastele Grok-mudelitele, mis on veelgi võimsamad ja murrangulisemad. Grok tulevased versioonid võivad olla võimelised töötlema video-, audio- ja reaalajas andmevooge.

Nende tehnoloogiate arenedes on neil potentsiaal muuta tööstusharusid, parandada õppimist ja laiendada meie kollektiivset teadmist viisil, mida me alles hakkame mõistma. Groki teekond tekstipõhisest chatbotist mitmemodaalseks, reaalajas suhtlevaks üksuseks on tunnistuseks tehisintellekti innovatsiooni kiirest tempost, mis lubab kasutajatele, arendajatele ja kogu tehnoloogiaühendusele põnevaid aegu.

Grok 4 peaks ilmuma 2025. aasta lõpuks.