Grok: Chatbot Elona Muska „hľadajúci maximálnu pravdu“

Grok je generatívny chatbot s umelou inteligenciou, ktorý vyvinula výskumná spoločnosť xAI založená Elonom Muskom. Podobne ako iné populárne chatboty, Grok dokáže generovať text alebo kód, analyzovať dáta a riešiť zložité problémy. Grok sa však odlišuje svojím zmyslom pre humor a netradičným myslením. V tomto článku sa pozrieme na históriu, schopnosti a výnimočné vlastnosti tohto chatbota.

História Groka

Elon Musk spoluzaložil spoločnosť OpenAI (známu vďaka ChatGPT) v roku 2015, ale o tri roky neskôr z nej odišiel, pretože „nesúhlasil s niektorými zámermi tímu OpenAI“.

V apríli 2023 Elon Musk v rozhovore povedal, že ChatGPT je príliš politicky korektný, zatiaľ čo on chcel vytvoriť „umelú inteligenciu, ktorá sa snaží o maximálne hľadanie pravdy a pochopiť podstatu vesmíru“. Predbežný názov tohto projektu bol TruthGPT (odvodený od anglického slova „truth“ – pravda).

Elon Musk predstavuje TruthGPT

Nakoniec zmenili názov na Grok, ktorý bol inšpirovaný sci-fi románom Roberta A. Heinleina z roku 1961 „Cudzinec v cudzej krajine“, kde termín „grok“ znamená hlboko a intuitívne niečo pochopiť.

Prvá verzia Groku bola vydaná v novembri 2023.
V marci 2024 bola aktualizovaná na Grok-1.5, ktorý ponúkal pokrokové logické schopnosti a väčšie kontextové okno s 128 000 tokenmi.
V decembri 2024 bol vydaný Grok-2. Tento model dokázal spracovávať text aj obrázky.

Nakoniec, v februári 2025, bol vydaný Grok 3. Elon Musk tento model nazval „desivo inteligentným“.

Táto nová verzia bola trénovaná na superpočítači Colossus s 10-násobne vyššou výpočtovou silou ako predchádzajúce najmodernejšie modely.

Výkon Groku

Elon Musk tvrdí, že Grok 3 je najinteligentnejšia umelá inteligencia na Zemi. Je naozaj taký dobrý, ako sa uvádza v reklame? Pozrime sa:

Grok 3 vykazuje o 20 % vyššiu presnosť v porovnaní so svojím predchodcom, čo bolo overené prostredníctvom štandardných benchmarkov NLP a umelej inteligencie.
O 25 % rýchlejšie spracovanie a o 15 % vyššia presnosť v porozumení prirodzenému jazyku a generovaní odpovedí v porovnaní s ChatGPT o1 pro a DeepSeek R1.
Pôsobivé výsledky v benchmarkoch z matematiky, vedy a programovania.

Matematika, veda, programovanie

Ďalšie referenčné hodnoty:

matematika, prírodné vedy, programovanie, multimodálne porozumenie

Ako vidíme na obrázkoch vyššie, Grok 3 je mimoriadne dobrý v:

matematike (AIME'25 a AIME'24)
prírodných vedách, ako je biológia, fyzika a chémia (GPQA)
kódovaní (LCB)
multimodálnom porozumení (MMMU)

Samotný benchmark MMMU obsahuje 11 500 otázok z rôznych disciplín, vrátane umenia a dizajnu, obchodu, zdravia a medicíny, vied, humanitných a spoločenských vied a techniky a inžinierstva.

Príklad MMMU

Skorá verzia Grok-3 (s kódovým názvom „Chocolate“) si zabezpečila prvé miesto v LMSYS Arena (platforma určená na hodnotenie a porovnávanie rôznych veľkých jazykových modelov v konkurenčnom prostredí), čím sa stala prvým modelom umelej inteligencie, ktorý prekonal skóre 1400 vo všetkých kategóriách.

Súčasné modely Grok

Grok 3 je k dispozícii v rôznych tvaroch a veľkostiach. Vlajkový model sa jednoducho nazýva Grok 3. Disponuje hlbokými znalosťami v oblasti financií, zdravotníctva, práva a vedy. Odľahčený model sa nazýva Grok 3 mini. Je rýchly, inteligentný a skvelý pre logické úlohy, ktoré nevyžadujú hlboké znalosti v danej oblasti.

Existujú aj rýchle varianty (grok-3-fast-beta a grok-3-mini-beta), ktoré používajú presne ten istý základný model a poskytujú identickú kvalitu odpovedí, ale sú poskytované na rýchlejšej infraštruktúre, čo vedie k výrazne rýchlejším časom odozvy.

Technické špecifikácie
Rýchlosť spracovania	1,5 petaflops
Parametre	2,7 bilióna
Školiace tokeny	12,8 biliónov
Odobrenie odpovede	67 milisekúnd (v priemere)
Okno kontextu	131072 tokenov

Grok dokáže analyzovať obrázky (popisovať obrázky, identifikovať objekty, čítať text):

Maximálna veľkosť obrázku: 10 MiB
Maximálny počet obrázkov: bez obmedzenia
Podporované typy obrazových súborov: jpg, jpeg, png
Akýkoľvek poradie obrázkov/textu je akceptované

Grok je tiež schopný generovať vysokokvalitné obrázky pomocou svojho autoregresívneho modelu generovania obrázkov s kódovým názvom Aurora. Tento model má natívnu podporu multimodálneho vstupu, čo mu umožňuje čerpať inšpiráciu z obrázkov poskytnutých používateľom alebo ich priamo upravovať. Upozorňujeme, že Aurora je k dispozícii na platforme X, ale nemusí byť nutne k dispozícii na iných platformách.

Modely Grok na oficiálnom API nie sú pripojené k internetu, čo znamená, že nemajú žiadne vedomosti o udalostiach vo svete po 17. novembri 2024.

Trénovanie Grok

Vývoj Grok 3 bol urýchlený superpočítačom Colossus od xAI, ktorý beží na 200 000 grafických procesoroch Nvidia H100 a H200. Nový model prešiel 200 miliónmi hodín tréningu na grafických procesoroch, čo je 10-krát viac ako Grok-2. Vďaka tomuto obrovskému skoku vo výpočtovom výkone dokáže Grok 3 spracovávať obrovské dátové súbory s bezprecedentnou efektívnosťou a dosahovať ešte väčšiu presnosť.

Vývojári upravili prístup k trénovaniu tak, aby zahŕňal syntetické dátové súbory, mechanizmy samokorekcie a posilňovacie učenie s cieľom zlepšiť výkon Grok 3:

Syntetické dátové súbory. Ide o umelo generované dáta vytvorené tak, aby napodobňovali reálne dáta bez použitia citlivých alebo dôverných informácií. Používajú sa na trénovanie jazykových modelov simuláciou rôznych scenárov, čím sa zabezpečuje rozmanitý a kontrolovaný dátový súbor, ktorý zvyšuje efektívnosť učenia a rieši otázky súkromia dát.
Mechanizmy samokorekcie. Grok-3 má zabudovanú schopnosť overovať fakty a v priebehu času vylepšovať svoje vlastné odpovede. Systém porovnáva svoje odpovede so spoľahlivými zdrojmi, vyhľadáva chyby a vylepšuje svoj prístup pre budúce použitie. Toto neustále samovylepšovanie znamená, že čím viac ho používate, tým menej chýb robí a postupne sa približuje k ľudskému výkonu v presnosti odpovedí. Nie je dokonalý, ale je navrhnutý tak, aby sa učil z každej interakcie.
Posilňovacie učenie. Typ strojového učenia, pri ktorom sa model umelej inteligencie učí prostredníctvom odmien alebo trestov za svoje činy, podobne ako ľudia nadobúdajú zručnosti prostredníctvom skúseností. Systém je trénovaný tak, aby maximalizoval pozitívne výsledky prostredníctvom pokusov a omylov, čím zlepšuje svoje rozhodovacie schopnosti.

Tieto techniky pomáhajú znížiť počet nesprávnych odpovedí, známych ako halucinácie, pomocou viacerých krokov overovania a efektívnejšie sa prispôsobujú prostredníctvom neustáleho sebahodnotenia a učenia.

Aby boli odpovede Groka prirodzenejšie a relevantnejšie, vývojári zaviedli ľudské spätné väzby (metóda trénovania, pri ktorej ľudia hodnotia presnosť, relevantnosť a užitočnosť umelo generovaného obsahu) a kontextové trénovanie (učí bota zohľadňovať predchádzajúce interakcie, zámery používateľov a okolité informácie, aby generoval presnejšie a relevantnejšie odpovede).

Unikátne vlastnosti Groka

Zatiaľ čo väčšina modelov umelej inteligencie sa drží formálneho tónu (a často pôsobí roboticky), Grok 3 vyniká svojím odvážnym a ironickým štýlom. Nebojí sa používať humor, sarkazmus a nekonvenčné vyjadrovanie. Grok uprednostňuje faktické, nezaujaté odpovede, ktoré často spochybňujú populárne naratívy. Zatiaľ čo iné neurónové siete sa vyhýbajú diskusii o zložitých témach, Grok zaujíma odlišný prístup. Nebojí sa diskutovať o filozofii, politike alebo etických dilemách. Grok dokáže zohľadniť viacero pohľadov a dokonca priznať, keď si nie je istý – čo je medzi chatbotmi vzácna črta. Vďaka tomu pôsobí Grok skôr ako konverzačný partner než ako generický stroj na odpovede.

Grok 3 je užitočný pre poľnohospodárov, podnikateľov, vodičov a tvorcov obsahu

Grok bol vytvorený s cieľom poskytovať maximálne užitočné a pravdivé odpovede. Bot vyniká pri spracovaní zložitých alebo otvorených otázok. Kým mnoho chatbotov vyniká v rýchlych faktoch alebo skriptovaných odpovediach, Grok je navrhnutý tak, aby zvládal nuansované otázky, najmä v oblastiach ako veda a kritické myslenie. Dokáže rozložiť zložité témy, ako je kvantová mechanika alebo etické dilemy, na stráviteľné vysvetlenia bez ich zjednodušovania. Vďaka tomu je ideálnou voľbou pre používateľov, ktorí chcú viac ako povrchné odpovede, či už sú to študenti, výskumníci alebo zvedavé mysle.

Používatelia tiež poznamenávajú, že tento bot cenzuruje svoje odpovede oveľa menej ako ChatGPT alebo Claude. Grok má však bezpečnostné protokoly, ktoré zabraňujú škodlivým alebo nezákonným pokynom, ako je napríklad výroba bomby. Ak by ste sa opýtali, bot by odpovedal vyhýbavo – možno by vysvetlil vedu o výbušninách všeobecným, neinštruktážnym spôsobom alebo by povedal: „Nechajme veci tak, ako sú; čo keby sme preskúmali niečo menej... horľavé?“ Tým sa vyvažuje otvorenosť a zodpovednosť, na rozdiel od niektorých chatbotov, ktoré by mohli konverzáciu úplne ukončiť alebo poskytnúť príliš vágne odpovede.

Budúcnosť Groka

Elon Musk v živom vysielaní spomenul, že Grok 3 čoskoro zahrnie hlasový režim, v ktorom budú používatelia môcť komunikovať s chatbotom Grok prostredníctvom hlasových príkazov a dostávať hlasové odpovede generované umelou inteligenciou. So zavedením hlasového režimu v Grok 3 budú používatelia mať k dispozícii prirodzenejší a interaktívnejší spôsob komunikácie s umelou inteligenciou, čím sa stierajú hranice medzi komunikáciou človeka a stroja.

Prémiové funkcie, ako napríklad DeepSearch, Think mode a Big Brain mode, budú k dispozícii širšiemu publiku. DeepSearch je vyhľadávač Groku. Je navrhnutý tak, aby mal prístup k najnovším správam v reálnom čase, syntetizoval kľúčové informácie, uvažoval o protichodných faktoch a názoroch a vyťahoval jasnosť zo zložitosti. Think mode poskytuje reťazový prístup k podnetom používateľa. Výstupom je podrobný popis uvažovania modelu krok za krokom. Je vhodný pre zložité otázky vyžadujúce starostlivú logiku, ako sú matematické problémy, filozofické otázky alebo technické vysvetlenia. Režim Big Brain je rozsiahlejší, kreatívnejší alebo výpočtovo náročnejší režim, ktorý využíva širší kontext, pokročilé rozpoznávanie vzorov alebo väčšiu znalostnú bázu. Je ideálny na riešenie mnohostranných alebo otvorených otázok, generovanie inovatívnych nápadov alebo prepojenie bodov v rôznych oblastiach. Tento režim môže simulovať vyššiu úroveň abstrakcie alebo intuície.

Pokiaľ ide o hardvér, superpočítač Colossus od xAI je najväčší a najvýkonnejší systém na trénovanie umelej inteligencie na svete. Bol postavený za iba 122 dní, rýchlejšie, ako ktokoľvek predpokladal, a pôvodne bežal na 100 000 grafických procesoroch Nvidia H100.

Doba výstavby – 122 dní

Za impozantných 92 dní zdvojnásobila spoločnosť xAI svoju kapacitu na 200 000 grafických procesorov integráciou nových a výkonnejších čipov Blackwell H200 od spoločnosti Nvidia. Toto masívne zvýšenie výkonu je len začiatok. Spoločnosť xAI plánuje rozšíriť Colossus na 1 milión čipov, čím pripraví cestu pre budúce modely Grok, ktoré budú ešte výkonnejšie a prelomovejšie. Budúce verzie Groku budú pravdepodobne schopné spracovávať video, audio a dátové toky v reálnom čase.

Ako sa tieto technológie vyvíjajú, majú potenciál transformovať odvetvia, zlepšiť vzdelávanie a rozšíriť naše kolektívne vedomosti spôsobmi, ktoré len začíname chápať. Cesta Groku od textového chatbota k multimodálnej entite interagujúcej v reálnom čase je svedectvom rýchleho tempa inovácií v oblasti umelej inteligencie a sľubuje vzrušujúce časy pre používateľov, vývojárov a technologickú komunitu ako celok.

Grok 4 by mal byť uvedený na trh do konca roka 2025.