Grok: Elona Muska čatbots, kas “meklē maksimālo patiesību”

Grok ir ģeneratīvs mākslīgā intelekta čatbots, ko izstrādājusi Elona Muska dibinātā pētniecības kompānija xAI. Tāpat kā citi populāri čatboti, Grok var ģenerēt tekstu vai kodu, analizēt datus un risināt sarežģītas problēmas. Tomēr Grok atšķiras ar savu humora izjūtu un neordināro domāšanu. Šajā rakstā mēs iepazīsim čatbota vēsturi, iespējas un izcilākās iezīmes.

Grok vēsture

Elons Musk 2015. gadā līdzdibināja OpenAI (pazīstams ar ChatGPT), bet 3 gadus vēlāk pameta uzņēmumu, jo “nepiekrīta daļai no OpenAI komandas iecerēm”.

2023. gada aprīlī Elons Musk intervijā teica, ka ChatGPT ir pārāk politkorekts, bet viņš vēlas radīt “maksimāli patiesību meklējošu AI, kas cenšas izprast visuma būtību”. Šī projekta provizoriskais nosaukums bija TruthGPT (atvasināts no angļu vārda “truth” – patiesība).

Elons Musk iepazīstina ar TruthGPT

Galu galā nosaukums tika mainīts uz Grok, kas bija iedvesmots no Roberta A. Heinleina 1961. gada zinātniskās fantastikas romāna “Stranger in a Strange Land” (Svešinieks svešā zemē), kur termins “grok” nozīmē kaut ko dziļi un intuitīvi saprast.

Grok pirmā versija tika izlaista 2023. gada novembrī.
2024. gada martā tā tika uzlabota līdz Grok-1.5, kas piedāvāja jaunākās loģiskās iespējas un lielāku konteksta logu ar 128 000 simboliem.
2024. gada decembrī tika izlaists Grok-2. Šis modelis varēja apstrādāt gan tekstu, gan attēlus.

Beidzot, 2025. gada februārī tika izlaists Grok 3. Elons Musk šo modeli nosauca par “baisi gudru”.

Šī jaunā versija tika apmācīta uz Colossus superdatoru, kura skaitļošanas jauda ir 10 reizes lielāka nekā iepriekšējiem modernākajiem modeļiem.

Grok veiktspēja

Elons Musk saka, ka Grok 3 ir gudrākais mākslīgais intelekts uz Zemes. Vai tas patiešām ir tik labs, kā tiek reklamēts? Paskatīsimies:

Grok 3 uzrāda par 20 % augstāku precizitāti salīdzinājumā ar savu priekšteci, kas pārbaudīta ar nozares standarta NLP un AI testiem.
Par 25 % ātrāka apstrādes ātrums un par 15 % augstāka precizitāte dabiskās valodas saprašanā un atbilžu ģenerēšanā salīdzinājumā ar ChatGPT o1 pro un DeepSeek R1.
Iespaidīgi rezultāti matemātikas, dabaszinātņu un programmēšanas testos.

Matemātika, dabaszinātnes, programmēšana

Vairāk salīdzinošo rādītāju:

Kā redzams attēlos augšā, Grok 3 ir ārkārtīgi labs šādās jomās:

matemātikā (AIME'25 un AIME'24)
dabas zinātnēs, piemēram, bioloģijā, fizikā un ķīmijā (GPQA)
kodēšanā (LCB)
daudzveidīgā izpratnē (MMMU)

MMMU etalonā vien ir iekļauti 11 500 jautājumi, kas aptver dažādu disciplīnu tēmas, tostarp mākslu un dizainu, uzņēmējdarbību, veselību un medicīnu, dabas zinātnes, humanitārās un sociālās zinātnes, kā arī tehnoloģijas un inženierzinātnes.

MMMU piemērs

Grok-3 agrīnā versija (kodētais nosaukums “Chocolate”) ieguva 1. vietu LMSYS Arena (platforma, kas izstrādāta, lai novērtētu un salīdzinātu dažādus liela apjoma valodas modeļus konkurētspējīgā vidē), kļūstot par pirmo mākslīgā intelekta modeli, kas visās kategorijās pārsniedza 1400 punktu robežu.

Grok pašreizējie modeļi

Grok 3 ir pieejams dažādās formās un izmēros. Galvenais modelis ir vienkārši saukts par Grok 3. Tam ir padziļinātas zināšanas finanšu, veselības aprūpes, tiesību un zinātnes jomā. Vieglākais modelis ir saukts par Grok 3 mini. Tas ir ātrs, viedots un lieliski piemērots loģikas uzdevumiem, kas neprasa padziļinātas zināšanas konkrētā jomā.

Ir arī ātrāki varianti (grok-3-fast-beta un grok-3-mini-beta), kas izmanto tieši to pašu pamatmodeli un nodrošina identisku atbilžu kvalitāti, bet tie darbojas uz ātrākas infrastruktūras, tādējādi nodrošinot ievērojami ātrāku atbilžu laiku.

Tehniskie parametri
Apstrādes ātrums	1,5 petaflops
Parametri	2,7 triljoni
Apmācības tokeni	12,8 triljoni
Atbildes aizture	67 milisekundes (vidēji)
Konteksta logs	131072 tokeni

Grok var analizēt attēlus (aprakstīt attēlus, identificēt objektus, lasīt tekstu):

Maksimālais attēla izmērs: 10 MiB
Maksimālais attēlu skaits: nav ierobežots
Atbalstītie attēlu failu tipi: jpg, jpeg, png
Jebkura attēlu/teksta ievades secība ir pieņemama

Turklāt Grok spēj ģenerēt augstas kvalitātes attēlus, izmantojot savu autoregresīvo attēlu ģenerēšanas modeli ar kodēto nosaukumu Aurora. Šis modelis nativā veidā atbalsta multimodālu ievadi, ļaujot tam smelties iedvesmu no lietotāju sniegtajiem attēliem vai tos tieši rediģēt. Lūdzu, ņemiet vērā, ka Aurora ir pieejama X platformā, bet var nebūt pieejama citās platformās.

Grok modeļi oficiālajā API nav savienoti ar internetu, kas nozīmē, ka tiem nav informācijas par notikumiem pasaulē pēc 2024. gada 17. novembra.

Grok apmācība

Grok 3 attīstību veicināja xAI superdators Colossus, kas darbojas ar 200 000 Nvidia H100 un H200 GPU. Jaunais modelis saņēma 200 miljonus GPU stundu apmācību – 10 reizes vairāk nekā Grok-2. Pateicoties šim milzīgajam skaitļošanas jaudas lēcienam, Grok 3 var apstrādāt milzīgus datu kopumus ar bezprecedenta efektivitāti, vienlaikus sasniedzot vēl lielāku precizitāti.

Izstrādātāji pielāgoja apmācības pieeju, iekļaujot sintētiskos datu kopumus, paškorekcijas mehānismus un pastiprinātu mācīšanos, lai uzlabotu Grok 3 veiktspēju:

Paškorekcijas mehānismi. Grok-3 ir iebūvēta spēja laika gaitā pārbaudīt faktus un precizēt savas atbildes. Sistēma salīdzina savas atbildes ar uzticamiem avotiem, atrod kļūdas un pielāgo savu pieeju nākamajai reizei. Šī nepārtraukta pašpilnveidošanās nozīmē, ka, jo vairāk jūs to lietojat, jo mazāk kļūdu tā pieļauj, pakāpeniski tuvinoties cilvēka precizitātei atbildēs. Tā nav nevainojama, bet ir izstrādāta, lai mācītos no katras mijiedarbības.
Pastiprināta apmācība. Mašīnmācīšanās veids, kurā AI modelis mācās, saņemot atlīdzību vai sodu par savām darbībām, līdzīgi kā cilvēki apgūst prasmes, gūstot pieredzi. Sistēma ir apmācīta, lai maksimāli palielinātu pozitīvos rezultātus, izmantojot izmēģinājumus un kļūdas, uzlabojot savas lēmumu pieņemšanas spējas.

Šīs metodes palīdz samazināt nepareizus atbildes, kas pazīstamas kā halucinācijas, izmantojot vairākus validācijas posmus, un efektīvāk pielāgoties, izmantojot nepārtrauktu pašnovērtējumu un mācīšanos

Lai Grok atbildes būtu dabiskākas un atbilstošākas, izstrādātāji ieviesa cilvēku atsauksmju ciklus (apmācības metode, kurā cilvēki novērtē mākslīgi ģenerēta satura precizitāti, atbilstību un lietderīgumu) un konteksta apmācību (tā māca botam ņemt vērā iepriekšējās mijiedarbības, lietotāja nolūku un apkārtējo informāciju, lai ģenerētu precīzākas un atbilstošākas atbildes).

Grok unikālās īpašības

Lai gan lielākā daļa AI modeļu ievēro formālu tonī (un bieži vien šķiet roboti), Grok 3 izceļas ar savu drosmīgo un ironisko stilu. Tas nebaidās izmantot humoru, sarkasmu un nekonvencionālas frāzes. Grok prioritāte ir faktiski, neobjektīvi atbildes, bieži apstrīdot populārus naratīvus. Kamēr citi neironu tīkli izvairās apspriest sarežģītas tēmas, Grok izmanto atšķirīgu pieeju. Tas nebaidās apspriest filozofiju, politiku vai ētiskas dilemmas. Grok spēj ņemt vērā vairākus viedokļus un pat atzīt, ja nav pārliecināts — tāda godīguma chatbotiem ir reti sastopama. Tādēļ Grok vairāk līdzinās sarunu biedram nekā vispārīgam atbilžu ģeneratoram.

Grok 3 ir noderīgs lauksaimniekiem, uzņēmējiem, autovadītājiem un satura veidotājiem.

Grok ir izstrādāts ar mērķi sniegt maksimāli noderīgas un patiesas atbildes. Bots izceļas, apstrādājot sarežģītus vai atvērtus jautājumus. Kamēr daudzi čatboti izceļas ar ātrām faktu atbildēm vai iepriekš sagatavotām atbildēm, Grok ir izstrādāts, lai risinātu niansētus jautājumus, īpaši tādās jomās kā zinātne un kritiskā domāšana. Tas spēj sadalīt sarežģītas tēmas, piemēram, kvantu mehāniku vai ētiskas dilemmas, saprotamos skaidrojumos, tos nepārvienojot. Tas padara to par izvēli lietotājiem, kuri vēlas vairāk nekā virspusējas atbildes, neatkarīgi no tā, vai tie ir studenti, pētnieki vai vienkārši zinātkāri cilvēki.

Turklāt lietotāji norāda, ka šis bots cenzē savas atbildes daudz mazāk nekā ChatGPT vai Claude. Tomēr Grok ir drošības protokoli, lai novērstu kaitīgas vai nelikumīgas instrukcijas, piemēram, par bumbas izgatavošanu. Ja jūs to jautātu, bots novirzītu sarunu, iespējams, vispārīgi un neinstruktīvi izskaidrojot sprāgstvielu zinātni vai sakot: “Nespridzināsim lietas; kā būtu, ja mēs izpētītu kaut ko mazāk... uzliesmojošu?” Tas līdzsvaro atklātību un atbildību, atšķirībā no dažiem čatbotiem, kas var pilnībā pārtraukt sarunu vai sniegt pārāk neskaidras atbildes.

Grok nākotne

Elons Musk livestreamā minēja, ka Grok 3 drīz būs pieejams balss režīms, kurā lietotāji varēs sarunāties ar Grok čatbotu, izmantojot runātas komandas, un saņemt mākslīgā intelekta ģenerētas balss atbildes. Ar balss režīma ieviešanu Grok 3 lietotāji varēs izbaudīt dabiskāku un interaktīvāku saziņu ar mākslīgo intelektu, kas izdzēsīs robežu starp cilvēku un mašīnu komunikāciju.

Premium funkcijas, piemēram, DeepSearch, Think mode un Big Brain mode, kļūs pieejamas plašākai auditorijai. DeepSearch ir Grok meklētājprogramma. Tā ir izstrādāta, lai piekļūtu jaunākajām ziņām reālajā laikā, apkopotu galveno informāciju, izvērtētu pretrunīgus faktus un viedokļus un izskaidrotu sarežģītas lietas. Think mode nodrošina domāšanas ķēdes pieeju lietotāja uzdotajam jautājumam. Rezultāts ir detalizēts modeļa domāšanas process. Tas ir piemērots sarežģītiem jautājumiem, kas prasa rūpīgu loģiku, piemēram, matemātikas uzdevumiem, filozofiskiem jautājumiem vai tehniskajiem paskaidrojumiem. Big Brain režīms ir plašāks, radošāks vai aprēķinu ziņā intensīvāks režīms, kas izmanto plašāku kontekstu, uzlabotu modeļu atpazīšanu vai lielāku zināšanu bāzi. Tas ir ideāli piemērots daudzpusīgu vai atvērtu jautājumu risināšanai, inovatīvu ideju ģenerēšanai vai dažādu jomu savienošanai. Šis režīms var simulēt augstāku abstrakcijas vai intuīcijas līmeni.

Attiecībā uz aparatūru, xAI superdators Colossus ir pasaulē lielākā un jaudīgākā mākslīgā intelekta apmācības sistēma. Tas tika izveidots tikai 122 dienās — ātrāk, nekā kāds bija prognozējis — un sākotnēji darbojās ar 100 000 Nvidia H100 GPU.

Būvniecības laiks – 122 dienas

Iespaidīgos 92 dienās xAI divkāršoja savu jaudu līdz 200 000 GPU, integrējot Nvidia jaunās un jaudīgākās Blackwell H200 mikroshēmas. Šis milzīgais jaudas pieaugums ir tikai sākums. xAI plāno palielināt Colossus līdz 1 miljonam mikroshēmu, tādējādi pavērtot ceļu nākotnes Grok modeļiem, kas būs vēl jaudīgāki un revolucionārāki. Nākamās Grok versijas varēs apstrādāt video, audio un reāllaika datu plūsmas.

Šīs tehnoloģijas attīstoties, tās var pārveidot nozares, uzlabot mācīšanos un paplašināt mūsu kopējās zināšanas veidos, kurus mēs tikai sākam saprast. Grok ceļš no teksta čatbota līdz multimodālai, reāllaika mijiedarbības vienībai liecina par straujo mākslīgā intelekta inovāciju attīstību, kas sola aizraujošu nākotni lietotājiem, izstrādātājiem un visai tehnoloģiju kopienai.

Grok 4 paredzēts izlaist līdz 2025. gada beigām.