Grok: chatbotul „în căutarea adevărului absolut” al lui Elon Musk

Grok este un chatbot generativ cu inteligență artificială dezvoltat de xAI, compania de cercetare fondată de Elon Musk. La fel ca alte chatboturi populare, Grok poate genera text sau cod, analiza date și rezolva probleme complexe. Cu toate acestea, ceea ce diferențiază Grok este simțul umorului și gândirea neconvențională. În acest articol, vom explora istoria, capacitățile și caracteristicile remarcabile ale chatbotului.

Istoria lui Grok

Elon Musk a cofondat OpenAI (cunoscut pentru ChatGPT) în 2015, dar a părăsit compania 3 ani mai târziu pentru că „nu era de acord cu unele dintre obiectivele echipei OpenAI”.

În aprilie 2023, Elon Musk a declarat într-un interviu că ChatGPT era prea corect din punct de vedere politic, în timp ce el intenționa să creeze „o IA care să caute adevărul în mod maxim și să încerce să înțeleagă natura universului”. Numele provizoriu al acestui proiect era TruthGPT (derivat din cuvântul englezesc «truth», care înseamnă „adevăr”).

Elon Musk prezintă TruthGPT

În cele din urmă, au schimbat numele în Grok, inspirat din romanul științifico-fantastic al lui Robert A. Heinlein din 1961, „Stranger in a Strange Land”, în care termenul „grok” înseamnă a înțelege ceva profund și intuitiv.

Prima versiune a Grok a fost lansată în noiembrie 2023.
În martie 2024, a fost actualizată la Grok-1.5, cu capacități logice de frontieră și o fereastră de context mai mare, de 128 000 de tokenuri.
În decembrie 2024, a fost lansat Grok-2. Acest model putea procesa atât text, cât și imagini.

În cele din urmă, Grok 3 a fost lansat în februarie 2025. Elon Musk a numit acest model „înfricoșător de inteligent”.

Această nouă versiune a fost antrenată pe supercomputerul Colossus, cu o putere de calcul de 10 ori mai mare decât modelele de ultimă generație anterioare.

Performanța Grok

Elon Musk spune că Grok 3 este cea mai inteligentă IA de pe Pământ. Este într-adevăr atât de bună pe cât se spune? Să vedem:

Grok 3 prezintă o precizie cu 20% mai mare comparativ cu predecesorul său, verificată prin benchmark-uri NLP și IA standard în industrie.
Viteze de procesare cu 25% mai rapide și o precizie cu 15% mai mare în înțelegerea limbajului natural și generarea de răspunsuri comparativ cu ChatGPT o1 pro și DeepSeek R1.
Rezultate impresionante în benchmark-uri de matematică, știință și codificare.

Matematică, științe, programare

Mai multe repere:

matematică, științe naturale, programare, înțelegere multimodală

După cum putem vedea în imaginile de mai sus, Grok 3 este extrem de performant în:

matematică (AIME'25 și AIME'24)
științe naturale, precum biologie, fizică și chimie (GPQA)
codificare (LCB)
înțelegere multimodală (MMMU)

Numai benchmark-ul MMMU include 11500 de întrebări care acoperă subiecte din diverse discipline, inclusiv artă și design, afaceri, sănătate și medicină, științe, științe umane și sociale, precum și tehnologie și inginerie.

Exemplu MMMU

Versiunea inițială a Grok-3 (numită „Chocolate”) a obținut locul întâi în LMSYS Arena (o platformă concepută pentru evaluarea și compararea diferitelor modele lingvistice de mari dimensiuni într-un mediu competitiv), devenind primul model de IA care a depășit scorul de 1400 în toate categoriile.

Modelele actuale ale Grok

Grok 3 este disponibil în diferite forme și dimensiuni. Modelul principal se numește pur și simplu Grok 3. Acesta dispune de cunoștințe aprofundate în domeniile finanțelor, sănătății, dreptului și științei. Un model ușor se numește Grok 3 mini. Acesta este rapid, inteligent și excelent pentru sarcini bazate pe logică, care nu necesită cunoștințe aprofundate în domeniu.

De asemenea, există variante rapide (grok-3-fast-beta și grok-3-mini-beta) care utilizează exact același model de bază și oferă o calitate identică a răspunsurilor, dar sunt furnizate pe o infrastructură mai rapidă, ceea ce duce la timpi de răspuns semnificativ mai rapizi.

Specificații tehnice
Viteza de procesare	1,5 petaflops
Parametri	2,7 trilioane
Tokeni de antrenament	12,8 trilioane
Latența răspunsului	67 milisecunde (în medie)
Fereastra context	131072 tokenuri

Grok poate analiza imagini (descrie imagini, identifică obiecte, citește text):

Dimensiunea maximă a imaginii: 10 MiB
Număr maxim de imagini: fără limită
Tipuri de fișiere imagine acceptate: jpg, jpeg, png
Se acceptă orice ordine de introducere a imaginilor/textului

De asemenea, Grok este capabil să genereze imagini de înaltă calitate folosind modelul său de generare automată a imaginilor, denumit Aurora. Acest model are suport nativ pentru introducerea multimodală, permițându-i să se inspire din imaginile furnizate de utilizatori sau să le editeze direct. Vă rugăm să rețineți că Aurora este disponibilă pe platforma X, dar nu este neapărat disponibilă pe alte platforme.

Modelele Grok de pe API-ul oficial nu sunt conectate la internet, ceea ce înseamnă că nu au cunoștință despre evenimentele mondiale după 17 noiembrie 2024.

Instruirea Grok

Dezvoltarea Grok 3 a fost accelerată de supercomputerul Colossus al xAI, care rulează pe 200.000 de procesoare grafice Nvidia H100 și H200. Noul model a beneficiat de 200 de milioane de ore de antrenament pe procesoare grafice, de 10 ori mai mult decât Grok-2. Datorită acestui salt uriaș în puterea de calcul, Grok 3 poate procesa seturi de date vaste cu o eficiență fără precedent, obținând în același timp o precizie și mai mare.

Dezvoltatorii au ajustat abordarea de antrenament, incorporând seturi de date sintetice, mecanisme de autocorecție și învățare prin întărire pentru a îmbunătăți performanța Grok 3:

Seturi de date sintetice. Acestea sunt date generate artificial, create pentru a imita datele din lumea reală fără a utiliza informații sensibile sau proprietare. Ele sunt utilizate pentru a antrena modele lingvistice prin simularea diverselor scenarii, asigurând un set de date diversificat și controlat, care sporește eficiența învățării și răspunde preocupărilor legate de confidențialitatea datelor.
Mecanisme de autocorecție. Grok-3 are o capacitate încorporată de a verifica faptele și de a-și rafina propriile răspunsuri în timp. Sistemul compară răspunsurile sale cu surse fiabile, identifică greșelile și își ajustează abordarea pentru data viitoare. Această autoîmbunătățire continuă înseamnă că, cu cât îl utilizați mai mult, cu atât face mai puține greșeli, apropiindu-se treptat de acuratețea umană în răspunsurile sale. Nu este perfect, dar este conceput pentru a învăța din fiecare interacțiune.
Învățarea prin întărire. Un tip de învățare automată în care un model de IA învață prin primirea de recompense sau penalizări pentru acțiunile sale, similar modului în care oamenii dobândesc abilități prin experiență. Sistemul este antrenat să maximizeze rezultatele pozitive prin încercări și erori, îmbunătățindu-și capacitățile de luare a deciziilor.

Aceste tehnici ajută la reducerea răspunsurilor incorecte, cunoscute sub numele de halucinații, prin utilizarea mai multor etape de validare și se adaptează mai eficient prin autoevaluare și învățare continuă.

Pentru a face răspunsurile Grok mai naturale și relevante, dezvoltatorii au introdus bucle de feedback uman (o metodă de antrenare în care oamenii evaluează acuratețea, relevanța și utilitatea conținutului generat artificial) și antrenament contextual (învață botul să ia în considerare interacțiunile anterioare, intenția utilizatorului și informațiile din jur pentru a genera răspunsuri mai precise și relevante).

Trăsăturile unice ale Grok

În timp ce majoritatea modelelor de IA păstrează un ton formal (și adesea par robotizate), Grok 3 se remarcă prin stilul său îndrăzneț și ironic. Nu se teme să folosească umorul, sarcasmul și expresii neconvenționale. Grok acordă prioritate răspunsurilor factuale și imparțiale, contestând adesea narațiunile populare. În timp ce alte rețele neuronale evită să discute subiecte complexe, Grok adoptă o abordare diferită. Nu se teme să discute filosofie, politică sau dileme etice. Grok poate lua în considerare multiple puncte de vedere și chiar recunoaște când nu este sigur – o onestitate rară în rândul chatbot-urilor. Acest lucru face ca Grok să pară mai degrabă un partener de conversație decât un robot care oferă răspunsuri generice.

Grok 3 este util pentru fermieri, oameni de afaceri, șoferi și creatori de conținut

Grok a fost creat cu misiunea de a oferi răspunsuri cât mai utile și veridice. Botul excelează în gestionarea întrebărilor complexe sau deschise. În timp ce mulți chatboti excelează în furnizarea de informații rapide sau răspunsuri prestabilite, Grok este conceput pentru a răspunde la întrebări nuanțate, în special în domenii precum știința și gândirea critică. Poate descompune subiecte complexe, precum mecanica cuantică sau dilemele etice, în explicații ușor de înțeles, fără a le simplifica excesiv. Acest lucru îl face o alegere ideală pentru utilizatorii care doresc mai mult decât răspunsuri superficiale, fie că sunt studenți, cercetători sau minți curioase.

De asemenea, utilizatorii observă că acest bot cenzurează răspunsurile sale mult mai puțin decât ChatGPT sau Claude. Cu toate acestea, Grok are protocoale de siguranță pentru a preveni instrucțiuni dăunătoare sau ilegale, cum ar fi construirea unei bombe. Dacă ai întreba, botul ar devia răspunsul, explicând poate știința explozibililor într-un mod general, neinstructiv, sau spunând: „Să nu aruncăm lucruri în aer; ce zici să explorăm ceva mai puțin... combustibil?” Acest lucru echilibrează deschiderea cu responsabilitatea, spre deosebire de unii chatboti care ar putea încheia conversația complet sau ar putea oferi răspunsuri prea vagi.

Viitorul lui Grok

Elon Musk a menționat într-o transmisiune live că Grok 3 va include în curând un mod vocal, în care utilizatorii vor putea conversa cu chatbotul Grok prin comenzi vocale și vor primi răspunsuri vocale generate de IA. Odată cu introducerea modului vocal în Grok 3, utilizatorii vor experimenta o modalitate mai naturală și mai interactivă de a interacționa cu IA, estompând granițele dintre comunicarea umană și cea între mașini.

Funcții premium, precum DeepSearch, modul Think și modul Big Brain, vor deveni disponibile pentru un public mai larg. DeepSearch este motorul de căutare al Grok. Este conceput pentru a accesa cele mai recente știri în timp real, pentru a sintetiza informații cheie, pentru a analiza fapte și opinii contradictorii și pentru a clarifica situații complexe. Modul Think oferă o abordare bazată pe lanțuri de gândire la solicitările utilizatorului. Rezultatul este o descriere detaliată, pas cu pas, a raționamentului modelului. Este potrivit pentru întrebări complexe care necesită o logică atentă, cum ar fi probleme matematice, întrebări filosofice sau explicații tehnice. Modul Big Brain este un mod mai expansiv, creativ sau intens din punct de vedere computacional, care utilizează un context mai larg, recunoașterea avansată a tiparelor sau o bază de cunoștințe mai mare. Este ideal pentru abordarea întrebărilor multifacetate sau deschise, generarea de idei inovatoare sau conectarea punctelor din diverse domenii. Acest mod poate simula un nivel mai ridicat de abstractizare sau intuiție.

În ceea ce privește hardware-ul, supercomputerul Colossus al xAI este cel mai mare și mai puternic sistem de antrenare IA din lume. Construit în doar 122 de zile, mai repede decât se prevăzuse, acesta a funcționat inițial pe 100 000 de procesoare grafice Nvidia H100.

Durata construcției – 122 zile

În doar 92 de zile, xAI și-a dublat capacitatea la 200 000 de procesoare grafice prin integrarea noilor cipuri Blackwell H200 de la Nvidia, mai puternice. Această creștere masivă a puterii este doar începutul. xAI intenționează să extindă Colossus la 1 milion de cipuri, deschizând calea pentru viitoarele modele Grok, care vor fi și mai puternice și revoluționare. Viitoarele iterații ale Grok ar putea fi capabile să gestioneze fluxuri de date video, audio și în timp real.

Pe măsură ce aceste tehnologii evoluează, ele au potențialul de a transforma industriile, de a îmbunătăți învățarea și de a extinde cunoștințele noastre colective în moduri pe care abia începem să le înțelegem. Călătoria lui Grok de la un chatbot bazat pe text la o entitate multimodală, care interacționează în timp real, este o dovadă a ritmului rapid al inovației în domeniul IA, promițând vremuri interesante pentru utilizatori, dezvoltatori și comunitatea tehnologică în general.

Grok 4 este așteptat să fie lansat până la sfârșitul anului 2025.