Grok: Elon Muskov chatbot za »iskanje največje resnice«

Grok je generativni chatbot z umetno inteligenco, ki ga je razvilo raziskovalno podjetje xAI, ki ga je ustanovil Elon Musk. Tako kot drugi priljubljeni chatboti lahko Grok ustvarja besedilo ali kodo, analizira podatke in rešuje zapletene probleme. Toda Grok se od drugih razlikuje po svojem smislu za humor in nekonvencionalnem razmišljanju. V tem članku bomo raziskali zgodovino, zmogljivosti in izstopajoče lastnosti tega chatbota.

Zgodovina Groka

Elon Musk je leta 2015 soustanovil OpenAI (znano po ChatGPT), vendar je podjetje zapustil tri leta kasneje, ker se »ni strinjal z nekaterimi stvarmi, ki jih je želela narediti ekipa OpenAI«.

Aprila 2023 je Elon Musk v intervjuju dejal, da je ChatGPT preveč politično korekten, medtem ko je sam nameraval ustvariti »umetno inteligenco, ki bo v največji možni meri iskala resnico in poskušala razumeti naravo vesolja«. Začasno ime tega projekta je bilo TruthGPT (izpeljano iz angleške besede »truth« – resnica).

Elon Musk predstavlja TruthGPT

Nazadnje so ime spremenili v Grok, ki je navdihnjeno po znanstvenofantastičnem romanu Roberta A. Heinleina iz leta 1961 z naslovom »Stranger in a Strange Land«, kjer izraz »grok« pomeni globoko in intuitivno razumevanje nečesa.

Prva različica Groka je bila izdana novembra 2023.
Marca 2024 je bila nadgrajena na Grok-1.5, ki je vključevala najsodobnejše logične zmogljivosti in večje kontekstno okno s 128.000 tokeni.
Decembra 2024 je bil izdan Grok-2. Ta model je lahko obdeloval tako besedilo kot slike.

Nazadnje je bil februarja 2025 izdan Grok 3. Elon Musk je ta model označil za »strašno pametnega«.

Ta nova različica je bila usposobljena na superračunalniku Colossus, ki ima 10-krat večjo računalniško moč kot prejšnji najsodobnejši modeli.

Zmogljivost Groka

Elon Musk pravi, da je Grok 3 najpametnejša umetna inteligenca na Zemlji. Ali je res tako dober, kot ga oglašujejo? Poglejmo:

Grok 3 kaže 20 % večjo natančnost v primerjavi s svojim predhodnikom, kar je bilo preverjeno z industrijskimi standardi NLP in umetne inteligence.
25 % hitrejša obdelava in 15 % večja natančnost pri razumevanju naravnega jezika in generiranju odgovorov v primerjavi z ChatGPT o1 pro in DeepSeek R1.
Impresivni rezultati v matematiki, znanosti in programiranju.

Matematika, naravoslovje, programiranje

Več primerjav:

Kot lahko vidimo na zgornjih slikah, je Grok 3 izjemno dober v:

matematiki (AIME'25 in AIME'24)
naravoslovju, kot so biologija, fizika in kemija (GPQA)
programiranju (LCB)
multimodalnem razumevanju (MMMU)

Samo merilo MMMU vključuje 11.500 vprašanj, ki pokrivajo različne discipline, vključno z umetnostjo in oblikovanjem, poslovnim svetom, zdravjem in medicino, naravoslovjem, humanistiko in družboslovjem ter tehnologijo in inženirstvom.

Primer MMMU

Zgodnja različica Grok-3 (z delovnim imenom „Chocolate“) je osvojila prvo mesto v LMSYS Arena (platformi za ocenjevanje in primerjavo različnih velikih jezikovnih modelov v konkurenčnem okolju) in tako postala prvi model umetne inteligence, ki je presegel oceno 1400 v vseh kategorijah.

Trenutni modeli Grok

Grok 3 je na voljo v različnih oblikah in velikostih. Najboljši model se imenuje preprosto Grok 3. Ima poglobljeno znanje na področjih financ, zdravstva, prava in znanosti. Lažji model se imenuje Grok 3 mini. Je hiter, pameten in odličen za logične naloge, ki ne zahtevajo poglobljenega znanja.

Obstajajo tudi hitre različice (grok-3-fast-beta in grok-3-mini-beta), ki uporabljajo popolnoma enak osnovni model in zagotavljajo enako kakovost odziva, vendar delujejo na hitrejši infrastrukturi, kar omogoča bistveno hitrejše odzivne čase.

Tehnične specifikacije
Hitrost obdelave	1,5 petaflopov
Parametri	2,7 bilijona
Tokeni za usposabljanje	12,8 bilijona
Odzivni čas	67 milisekund (povprečno)
Okno konteksta	131072 tokenov

Grok lahko analizira slike (opisuje slike, prepoznava predmete, bere besedilo):

Največja velikost slike: 10 MiB
Največje število slik: brez omejitve
Podprti tipi slikovnih datotek: jpg, jpeg, png
Sprejeta je poljubna vrstna reditev slik/besedila

Grok je z avtorskim modelom avtomatskega generiranja slik, imenovanim Aurora, sposoben ustvarjati visokokakovostne slike. Ta model ima vgrajeno podporo za multimodalni vnos, kar mu omogoča, da črpa navdih iz slik, ki jih zagotovi uporabnik, ali jih neposredno ureja. Upoštevajte, da je Aurora na voljo na platformi X, vendar ni nujno na voljo na drugih platformah.

Modeli Grok na uradnem API niso povezani z internetom, kar pomeni, da nimajo znanja o svetovnih dogodkih po 17. novembru 2024.

Usposabljanje Grok

Razvoj Grok 3 je bil pospešen s superračunalnikom Colossus podjetja xAI, ki deluje na 200.000 grafičnih procesorjih Nvidia H100 in H200. Novi model je bil usposobljen 200 milijonov grafičnih procesorskih ur – 10-krat več kot Grok-2. Zahvaljujoč temu ogromnemu skoku v računalniški moči lahko Grok 3 obdeluje ogromne podatkovne nize z doslej nedosegljivo učinkovitostjo, hkrati pa dosega še večjo natančnost.

Razvijalci so prilagodili pristop usposabljanja z vključitvijo sintetičnih podatkovnih nizov, mehanizmov samokorekcije in okrepljenega učenja, da bi izboljšali zmogljivost Grok 3:

Mehanizmi samokorekcije. Grok-3 ima vgrajeno sposobnost preverjanja dejstev in izpopolnjevanja lastnih odgovorov sčasoma. Sistem primerja svoje odgovore z zanesljivimi viri, odkrije napake in prilagodi svoj pristop za naslednjič. To nenehno samoukrepanje pomeni, da več kot ga uporabljate, manj napak naredi in se postopoma približuje človeški natančnosti v odgovorih. Ni brezhiben, vendar je zasnovan tako, da se uči iz vsake interakcije.
Učenje s krepitvijo. Vrsta strojnega učenja, pri kateri se model umetne inteligence uči z nagradami ali kaznimi za svoje dejanje, podobno kot ljudje pridobivajo spretnosti z izkušnjami. Sistem je usposobljen za doseganje čim bolj pozitivnih rezultatov s poskusi in napakami, s čimer izboljšuje svoje sposobnosti odločanja.

Te tehnike pomagajo zmanjšati napačne odgovore, znane kot halucinacije, z uporabo več stopenj preverjanja in se učinkoviteje prilagajajo s stalnim samoocenjevanjem in učenjem.

Da bi odgovori Groka postali bolj naravni in ustrezni, so razvijalci uvedli povratne zanke človeškega povratnega informacij (metoda usposabljanja, pri kateri ljudje ocenijo točnost, ustreznost in uporabnost umetno ustvarjenih vsebin) in kontekstualno usposabljanje (bot se nauči upoštevati prejšnje interakcije, namere uporabnika in okoliške informacije, da lahko ustvari natančnejše in ustreznejše odgovore).

Edinstvene lastnosti Groka

Medtem ko večina modelov umetne inteligence ostaja pri formalnem tonu (in pogosto deluje robotično), se Grok 3 odlikuje po drznem in ironičnem slogu. Ne boji se uporabiti humorja, sarkazma in nekonvencionalnih izrazov. Grok daje prednost dejanskim, nepristranskim odgovorom, ki pogosto izzivajo popularne narative. Medtem ko se druga nevronska omrežja izogibajo razpravi o zapletenih temah, Grok ima drugačen pristop. Ne boji se razpravljati o filozofiji, politiki ali etičnih dilemah. Grok lahko upošteva več zornih kotov in celo prizna, kadar ni prepričan – to je iskrenost, ki je med chatboti redka. Zaradi tega se Grok zdi bolj kot sogovornik kot pa generični odzivnik.

Grok 3 je koristen za kmete, poslovneže, voznike in ustvarjalce vsebin

Grok je bil ustvarjen z namenom, da zagotavlja čim bolj koristne in resnične odgovore. Bot se izkaže pri obravnavanju zapletenih ali odprtih vprašanj. Medtem ko mnogi chatboti blestijo pri hitrih dejstvih ali vnaprej pripravljenih odgovorih, je Grok zasnovan za obravnavanje nianansiranih vprašanj, zlasti na področjih, kot so znanost in kritično mišljenje. Zapletene teme, kot so kvantna mehanika ali etične dileme, lahko razčleni v razumljive razlage, ne da bi jih poenostavil. To ga naredi prvo izbiro za uporabnike, ki želijo več kot le površinske odgovore, najsi gre za študente, raziskovalce ali radovedneže.

Poleg tega uporabniki opažajo, da ta bot veliko manj cenzurira svoje odgovore kot ChatGPT ali Claude. Vendar ima Grok varnostne protokole, ki preprečujejo škodljiva ali nezakonita navodila, kot je izdelava bombe. Če bi ga vprašali, bi bot odvrnil – morda bi na splošno in ne poučno razložil znanost eksplozivov ali rekel: »Ne razstreljujmo stvari; kaj pa, če raziščemo kaj manj ... vnetljivega?« To uravnava odprtost z odgovornostjo, za razliko od nekaterih chatbotov, ki bi pogovor lahko povsem prekinili ali dali preveč nejasne odgovore.

Prihodnost Groka

Elon Musk je v livestreamu omenil, da bo Grok 3 kmalu vključeval glasovni način, v katerem bodo uporabniki lahko komunicirali s Grokovim chatbotom prek glasovnih ukazov in prejemali glasovne odgovore, ki jih bo ustvarila umetna inteligenca. Z uvedbo glasovnega načina v Grok 3 bodo uporabniki doživeli bolj naraven in interaktiven način komuniciranja z umetno inteligenco, kar bo zabrisalo meje med komunikacijo med človekom in strojem.

Premium funkcije, kot so DeepSearch, Think mode in Big Brain mode, bodo na voljo širšemu občinstvu. DeepSearch je Grokov iskalnik. Zasnovan je za dostop do najnovejših novic v realnem času, sintezo ključnih informacij, razmišljanje o nasprotujočih si dejstvih in mnenjih ter pojasnjevanje zapletenih zadev. Think mode omogoča verigo misli v odgovoru na uporabnikovo vprašanje. Rezultat je podrobna predstavitev razmišljanja modela. Primeren je za zapletena vprašanja, ki zahtevajo skrbno logiko, kot so matematični problemi, filozofska vprašanja ali tehnična pojasnila. Način Big Brain je bolj razširjen, ustvarjalen ali računsko intenziven način, ki izkorišča širši kontekst, napredno prepoznavanje vzorcev ali večjo bazo znanja. Idealno je za reševanje večplastnih ali odprtih vprašanj, ustvarjanje inovativnih idej ali povezovanje točk med različnimi področji. Ta način lahko simulira višjo raven abstrakcije ali intuicije.

Kar zadeva strojno opremo, je superračunalnik Colossus podjetja xAI največji in najzmogljivejši sistem za usposabljanje umetne inteligence na svetu. Zgrajen je bil v samo 122 dneh – hitreje, kot je kdorkoli napovedoval – in je sprva deloval na 100.000 grafičnih procesorjih Nvidia H100.

Čas gradnje – 122 dni

V impresivnih 92 dneh je xAI podvojil svojo zmogljivost na 200.000 grafičnih procesorjev z integracijo novih in zmogljivejših čipov Blackwell H200 podjetja Nvidia. Ta ogromen povečanje zmogljivosti je šele začetek. xAI načrtuje povečanje Colossusa na 1 milijon čipov, s čimer bo utrl pot za prihodnje modele Grok, ki bodo še zmogljivejši in revolucionarni. Prihodnje različice Groka bodo morda sposobne obdelovati video, avdio in podatkovne tokove v realnem času.

S razvojem teh tehnologij se odpirajo možnosti za preoblikovanje industrije, izboljšanje učenja in širitev našega skupnega znanja na načine, ki jih šele začenjamo razumeti. Pot Groka od besedilnega chatbota do multimodalnega subjekta, ki komunicira v realnem času, je dokaz hitrega napredka na področju umetne inteligence in obeta vznemirljivo prihodnost za uporabnike, razvijalce in celotno tehnološko skupnost.

Grok 4 naj bi izšel konec leta 2025.