Grok: Chatbot Elona Muska „hledající maximální pravdu“

Grok je generativní chatbot s umělou inteligencí vyvinutý společností xAI, výzkumnou firmou založenou Elonem Muskem. Stejně jako jiné populární chatboty dokáže Grok generovat text nebo kód, analyzovat data a řešit složité problémy. Od ostatních chatbotů se však odlišuje svým smyslem pro humor a nekonvenčním myšlením. V tomto článku se podíváme na historii, schopnosti a nejzajímavější vlastnosti tohoto chatbota.

Historie Groku

Elon Musk spoluzaložil společnost OpenAI (známou díky ChatGPT) v roce 2015, ale o tři roky později ji opustil, protože „nesouhlasil s některými záměry týmu OpenAI“.

V dubnu 2023 Elon Musk v rozhovoru uvedl, že ChatGPT je příliš politicky korektní, zatímco on zamýšlel vytvořit „umělou inteligenci, která se bude maximálně snažit hledat pravdu a pochopit podstatu vesmíru“. Prozatímní název tohoto projektu byl TruthGPT (odvozeno od anglického slova „truth“, tedy pravda).

Elon Musk představuje TruthGPT

Nakonec název změnili na Grok, který byl inspirován sci-fi románem Roberta A. Heinleina z roku 1961 „Cizinec v cizí zemi“, kde termín „grok“ znamená hluboce a intuitivně něco pochopit.

První verze Groku byla vydána v listopadu 2023.
V březnu 2024 byla aktualizována na Grok-1.5, který se vyznačoval pokročilými logickými schopnostmi a větším kontextovým oknem o velikosti 128 000 tokenů.
V prosinci 2024 byl vydán Grok-2. Tento model dokázal zpracovávat jak text, tak obrázky.

Nakonec byl v únoru 2025 vydán Grok 3. Elon Musk tento model označil za „děsivě chytrý“.

Tato nová verze byla trénována na superpočítači Colossus s desetinásobným výpočetním výkonem oproti předchozím špičkovým modelům.

Výkon Groku

Elon Musk říká, že Grok 3 je nejchytřejší umělá inteligence na Zemi. Je opravdu tak dobrý, jak se tvrdí? Podívejme se na to:

Grok 3 vykazuje o 20 % vyšší přesnost ve srovnání se svým předchůdcem, což bylo ověřeno pomocí standardních benchmarků NLP a umělé inteligence.
O 25 % vyšší rychlost zpracování a o 15 % vyšší přesnost v porozumění přirozenému jazyku a generování odpovědí ve srovnání s ChatGPT o1 pro a DeepSeek R1.
Působivé výsledky v benchmarcích matematiky, vědy a kódování.

Matematika, přírodní vědy, programování

Další srovnávací testy:

Jak můžeme vidět na obrázcích výše, Grok 3 je mimořádně dobrý v:

matematice (AIME'25 a AIME'24)
přírodních vědách, jako je biologie, fyzika a chemie (GPQA)
kódování (LCB)
multimodálním porozumění (MMMU)

Samotný benchmark MMMU zahrnuje 11 500 otázek pokrývajících předměty z různých oborů, včetně umění a designu, obchodu, zdraví a medicíny, přírodních věd, humanitních a společenských věd a techniky a inženýrství.

Příklad MMMU

Raná verze Grok-3 (s kódovým označením „Chocolate“) si zajistila první místo v LMSYS Arena (platformě určené k hodnocení a porovnávání různých velkých jazykových modelů v konkurenčním prostředí) a stala se tak prvním modelem umělé inteligence, který překonal skóre 1400 ve všech kategoriích.

Aktuální modely Grok

Grok 3 je k dispozici v různých tvarech a velikostech. Vlajkový model se jednoduše nazývá Grok 3. Disponuje hlubokými znalostmi v oblastech financí, zdravotnictví, práva a vědy. Lehký model se nazývá Grok 3 mini. Je rychlý, chytrý a skvěle se hodí pro logické úkoly, které nevyžadují hluboké znalosti dané oblasti.

K dispozici jsou také rychlé varianty (grok-3-fast-beta a grok-3-mini-beta), které používají přesně stejný základní model a poskytují identickou kvalitu odpovědí, ale jsou poskytovány na rychlejší infrastruktuře, což vede k výrazně rychlejším odezvám.

Technické specifikace
Rychlost zpracování	1,5 petaflops
Parametry	2,7 bilionu
Školicí tokeny	12,8 bilionu
Odezva latence	67 milisekund (v průměru)
Okno kontextu	131072 tokenů

Grok dokáže analyzovat obrázky (popisovat obrázky, identifikovat objekty, číst text):

Maximální velikost obrázku: 10 MiB
Maximální počet obrázků: bez omezení
Podporované typy obrázků: jpg, jpeg, png
Akceptuje se libovolné pořadí obrázků/textu

Grok je také schopen generovat vysoce kvalitní obrázky pomocí svého autoregresivního modelu generování obrázků s kódovým názvem Aurora. Tento model má nativní podporu multimodálního vstupu, což mu umožňuje čerpat inspiraci z obrázků poskytnutých uživatelem nebo je přímo upravovat. Upozorňujeme, že Aurora je k dispozici na platformě X, ale nemusí být nutně k dispozici na jiných platformách.

Modely Grok na oficiálním API nejsou připojeny k internetu, což znamená, že nemají žádné znalosti o událostech ve světě po 17. listopadu 2024.

Trénink Grok

Vývoj Grok 3 byl urychlen superpočítačem Colossus od xAI, který běží na 200 000 grafických procesorech Nvidia H100 a H200. Nový model prošel 200 miliony hodin tréninku na grafických procesorech, což je 10krát více než Grok-2. Díky tomuto obrovskému skoku ve výpočetním výkonu může Grok 3 zpracovávat obrovské datové sady s bezprecedentní účinností a dosahovat ještě větší přesnosti.

Vývojáři upravili přístup k tréninku a začlenili syntetické datové sady, mechanismy samokorekce a posilující učení, aby vylepšili výkon Grok 3:

Syntetické datové sady. Jedná se o uměle generovaná data vytvořená tak, aby napodobovala data z reálného světa bez použití citlivých nebo proprietárních informací. Používají se k trénování jazykových modelů simulací různých scénářů, čímž zajišťují rozmanitou a kontrolovanou datovou sadu, která zvyšuje efektivitu učení a řeší otázky ochrany osobních údajů.
Mechanismy samokorekce. Grok-3 má zabudovanou schopnost ověřovat fakta a v průběhu času vylepšovat své vlastní odpovědi. Systém porovnává své odpovědi se spolehlivými zdroji, zjišťuje, kde se dopustil chyby, a upravuje svůj přístup pro příště. Toto neustálé sebezdokonalování znamená, že čím více jej používáte, tím méně chyb dělá a postupně se přibližuje lidské přesnosti ve svých odpovědích. Není bezchybný, ale je navržen tak, aby se učil z každé interakce.
Posilující učení. Typ strojového učení, při kterém se model umělé inteligence učí tím, že za své akce dostává odměny nebo tresty, podobně jako lidé získávají dovednosti prostřednictvím zkušeností. Systém je trénován tak, aby maximalizoval pozitivní výsledky prostřednictvím pokusů a omylů a zlepšoval své rozhodovací schopnosti.

Tyto techniky pomáhají snížit počet nesprávných odpovědí, známých jako halucinace, pomocí několika ověřovacích kroků a efektivněji se přizpůsobovat prostřednictvím neustálého sebehodnocení a učení.

Aby byly odpovědi Groku přirozenější a relevantnější, vývojáři zavedli zpětnou vazbu od lidí (metoda tréninku, při které lidé hodnotí přesnost, relevanci a užitečnost uměle generovaného obsahu) a kontextový trénink (učí bota zohledňovat předchozí interakce, záměr uživatele a okolní informace, aby generoval přesnější a relevantnější odpovědi).

Unikátní vlastnosti Groku

Zatímco většina modelů umělé inteligence se drží formálního tónu (a často působí roboticky), Grok 3 vyniká svým odvážným a ironickým stylem. Nebojí se používat humor, sarkasmus a nekonvenční formulace. Grok upřednostňuje faktické, nezaujaté odpovědi, které často zpochybňují populární narativy. Zatímco jiné neuronové sítě se vyhýbají diskusi o složitých tématech, Grok volí jiný přístup. Nebojí se diskutovat o filozofii, politice nebo etických dilematech. Grok dokáže zohlednit více úhlů pohledu a dokonce přiznat, když si není jistý – což je u chatbotů vzácná upřímnost. Díky tomu působí Grok spíše jako konverzační partner než generátor obecných odpovědí.

Grok 3 je užitečný pro zemědělce, podnikatele, řidiče a tvůrce obsahu

Grok byl vytvořen s cílem poskytovat maximálně užitečné a pravdivé odpovědi. Bot vyniká při zpracování složitých nebo otevřených otázek. Zatímco mnoho chatbotů exceluje v rychlých faktech nebo předem připravených odpovědích, Grok je navržen tak, aby zvládal nuancované dotazy, zejména v oblastech jako věda a kritické myšlení. Dokáže rozložit složité témata, jako je kvantová mechanika nebo etická dilemata, na srozumitelné vysvětlení, aniž by je zjednodušoval. Díky tomu je ideální volbou pro uživatele, kteří chtějí více než povrchní odpovědi, ať už jsou to studenti, výzkumníci nebo zvědavé mysli.

Uživatelé také poznamenávají, že tento bot cenzuruje své odpovědi mnohem méně než ChatGPT nebo Claude. Grok však má bezpečnostní protokoly, které zabraňují škodlivým nebo nelegálním pokynům, jako je například výroba bomby. Pokud byste se na to zeptali, bot by se vyhnul odpovědi – možná by vysvětlil vědu o výbušninách obecně, bez návodu, nebo by řekl: „Nenechme věci vybuchovat; co takhle prozkoumat něco méně... hořlavého?“ Tím je zajištěna rovnováha mezi otevřeností a odpovědností, na rozdíl od některých chatbotů, které by konverzaci úplně ukončily nebo poskytly příliš vágní odpovědi.

Budoucnost Groku

Elon Musk v živém vysílání zmínil, že Grok 3 brzy zahrne hlasový režim, ve kterém budou uživatelé moci komunikovat s chatbotem Grok pomocí hlasových příkazů a dostávat hlasové odpovědi generované umělou inteligencí. Se zavedením hlasového režimu v Grok 3 budou uživatelé moci komunikovat s umělou inteligencí přirozenějším a interaktivnějším způsobem, čímž se stírají hranice mezi komunikací mezi lidmi a stroji.

Prémiové funkce, jako jsou DeepSearch, Think mode a Big Brain mode, budou k dispozici širšímu publiku. DeepSearch je vyhledávač Groku. Je navržen tak, aby měl přístup k nejnovějším zprávám v reálném čase, syntetizoval klíčové informace, uvažoval o protichůdných faktech a názorech a vyvozoval jasné závěry ze složitých situací. Think mode poskytuje řetězový přístup k dotazu uživatele. Výstupem je podrobný popis uvažování modelu krok za krokem. Je vhodný pro složité otázky vyžadující pečlivou logiku, jako jsou matematické problémy, filozofické otázky nebo technická vysvětlení. Režim Big Brain je rozsáhlejší, kreativnější a výpočetně náročnější režim, který využívá širší kontext, pokročilé rozpoznávání vzorů nebo větší znalostní bázi. Je ideální pro řešení mnohostranných nebo otevřených otázek, generování inovativních nápadů nebo propojování bodů napříč různými obory. Tento režim může simulovat vyšší úroveň abstrakce nebo intuice.

Pokud jde o hardware, superpočítač Colossus od xAI je největším a nejvýkonnějším systémem pro trénování umělé inteligence na světě. Byl postaven za pouhých 122 dní – rychleji, než kdokoli předpovídal – a původně běžel na 100 000 grafických procesorech Nvidia H100.

Doba výstavby – 122 dní

Za pouhých 92 dní zdvojnásobila společnost xAI svou kapacitu na 200 000 grafických procesorů díky integraci nových a výkonnějších čipů Blackwell H200 od společnosti Nvidia. Tento obrovský nárůst výkonu je pouze začátek. Společnost xAI plánuje rozšířit Colossus na 1 milion čipů, čímž připraví půdu pro budoucí modely Grok, které budou ještě výkonnější a průlomovější. Budoucí verze Groku budou možná schopné zpracovávat video, audio a datové toky v reálném čase.

S vývojem těchto technologií mají potenciál transformovat průmyslová odvětví, zlepšit učení a rozšířit naše kolektivní znalosti způsoby, které teprve začínáme chápat. Cesta Groku od textového chatbota k multimodální entitě interagující v reálném čase je důkazem rychlého tempa inovací v oblasti umělé inteligence a slibuje vzrušující budoucnost pro uživatele, vývojáře a celou technologickou komunitu.

Grok 4 by měl být uveden na trh do konce roku 2025.