Torna alla pagina principale

Grok: il chatbot di Elon Musk alla “ricerca della verità assoluta”

Grok è un chatbot generativo basato sull'intelligenza artificiale sviluppato da xAI, la società di ricerca fondata da Elon Musk. Come altri chatbot popolari, Grok è in grado di generare testi o codici, analizzare dati e risolvere problemi complessi. Tuttavia, ciò che distingue Grok è il suo senso dell'umorismo e il suo modo di pensare fuori dagli schemi. In questo articolo esploreremo la storia, le capacità e le caratteristiche distintive di questo chatbot.

La storia di Grok

Elon Musk ha co-fondato OpenAI (nota per ChatGPT) nel 2015, ma ha lasciato l'azienda 3 anni dopo perché “non era d'accordo con alcune delle cose che il team di OpenAI voleva fare”.

Nell'aprile 2023, Elon Musk ha dichiarato in un'intervista che ChatGPT era troppo politicamente corretto, mentre lui intendeva creare “un'intelligenza artificiale che cercasse la verità assoluta e cercasse di comprendere la natura dell'universo”. Il nome provvisorio di questo progetto era TruthGPT (derivato dalla parola inglese “truth”, verità).

Elon Musk presenta TruthGPT

Elon Musk presenta TruthGPT

Alla fine hanno cambiato il nome in Grok, ispirandosi al romanzo di fantascienza di Robert A. Heinlein del 1961 “Stranger in a Strange Land”, dove il termine “grok” significa comprendere qualcosa in modo profondo e intuitivo.

  • La prima versione di Grok è stata rilasciata nel novembre 2023.
  • Nel marzo 2024 è stata aggiornata a Grok-1.5, con capacità logiche all'avanguardia e una finestra contestuale più ampia di 128.000 token.
  • Nel dicembre 2024 è stata rilasciata Grok-2. Questo modello era in grado di elaborare sia testo che immagini.
  • Infine, nel febbraio 2025 è stato rilasciato Grok 3. Elon Musk ha definito questo modello “spaventosamente intelligente”.

Questa nuova versione è stata addestrata sul supercomputer Colossus con una potenza di calcolo 10 volte superiore a quella dei modelli all'avanguardia precedenti.

Le prestazioni di Grok

Elon Musk afferma che Grok 3 è l'IA più intelligente al mondo. È davvero così valido come viene pubblicizzato? Vediamo:

  • Grok 3 mostra una precisione superiore del 20% rispetto al suo predecessore, verificata attraverso benchmark NLP e IA standard del settore.
  • Velocità di elaborazione superiore del 25% e precisione superiore del 15% nella comprensione del linguaggio naturale e nella generazione di risposte rispetto a ChatGPT o1 pro e DeepSeek R1.
  • Risultati impressionanti nei benchmark di matematica, scienze e codifica.
Matematica, scienze, programmazione

Matematica, scienze, programmazione

Altri benchmark:

matematica, scienze naturali, programmazione, comprensione multimodale

Come possiamo vedere nelle immagini sopra, Grok 3 è estremamente efficace in:

  • matematica (AIME'25 e AIME'24)
  • scienze naturali, come biologia, fisica e chimica (GPQA)
  • codifica (LCB)
  • comprensione multimodale (MMMU)

Il benchmark MMMU da solo include 11500 domande che coprono materie di diverse discipline, tra cui arte e design, economia, salute e medicina, scienze, scienze umane e sociali, tecnologia e ingegneria.

Esempio MMMU

Esempio MMMU

La versione iniziale di Grok-3 (nome in codice “Chocolate”) si è aggiudicata il primo posto nella LMSYS Arena (una piattaforma progettata per valutare e confrontare diversi modelli linguistici di grandi dimensioni in un ambiente competitivo), diventando il primo modello di IA a superare un punteggio di 1400 in tutte le categorie.

Classifica dei migliori chatbot

Modelli attuali di Grok

Grok 3 è disponibile in diverse forme e dimensioni. Il modello di punta si chiama semplicemente Grok 3. Possiede una profonda conoscenza dei settori finanziario, sanitario, legale e scientifico. Un modello leggero è chiamato Grok 3 mini. È veloce, intelligente e ottimo per compiti basati sulla logica che non richiedono una profonda conoscenza del settore.

Esistono anche varianti veloci (grok-3-fast-beta e grok-3-mini-beta) che utilizzano lo stesso identico modello di base e offrono una qualità di risposta identica, ma sono fornite su un'infrastruttura più veloce, con tempi di risposta notevolmente più rapidi.

Specifiche tecniche

Velocità di elaborazione1,5 petaflop
Parametri2,7 trilioni
Tokeni di addestramento12,8 trilioni
Latenza di risposta67 millisecondi (in media)
Finestra contestuale131072 tokeni

Grok è in grado di analizzare immagini (descrivere immagini, identificare oggetti, leggere testi):

  • Dimensione massima dell'immagine: 10 MiB
  • Numero massimo di immagini: Nessun limite
  • Tipi di file immagine supportati: jpg, jpeg, png
  • È accettato qualsiasi ordine di immagine/testo

Inoltre, Grok è in grado di generare immagini di alta qualità utilizzando il suo modello di generazione di immagini autoregressivo, nome in codice Aurora. Questo modello supporta nativamente l'input multimodale, consentendogli di trarre ispirazione dalle immagini fornite dall'utente o di modificarle direttamente. Si prega di notare che Aurora è disponibile sulla piattaforma X, ma potrebbe non essere necessariamente disponibile su altre piattaforme.

I modelli Grok sull'API ufficiale non sono connessi a Internet, il che significa che non hanno alcuna conoscenza degli eventi mondiali successivi al 17 novembre 2024.

Formazione di Grok

Lo sviluppo di Grok 3 è stato potenziato dal supercomputer Colossus di xAI, che funziona con 200.000 GPU Nvidia H100 e H200. Il nuovo modello ha ricevuto 200 milioni di ore di formazione su GPU, 10 volte di più rispetto a Grok-2. Grazie a questo enorme salto in avanti in termini di potenza di calcolo, Grok 3 è in grado di elaborare vasti set di dati con un'efficienza senza precedenti, ottenendo al contempo una precisione ancora maggiore.

Gli sviluppatori hanno modificato l'approccio di addestramento incorporando set di dati sintetici, meccanismi di autocorrezione e apprendimento rinforzato per migliorare le prestazioni di Grok 3:

  • Set di dati sintetici. Si tratta di dati generati artificialmente per imitare i dati del mondo reale senza utilizzare informazioni sensibili o proprietarie. Sono utilizzati per addestrare i modelli linguistici simulando vari scenari, garantendo un set di dati diversificato e controllato che aumenta l'efficienza dell'apprendimento e risponde alle preoccupazioni relative alla privacy dei dati.
  • Meccanismi di autocorrezione. Grok-3 ha una capacità integrata di verificare i fatti e perfezionare le proprie risposte nel tempo. Il sistema confronta le sue risposte con fonti affidabili, individua gli errori e modifica il suo approccio per la volta successiva. Questo miglioramento continuo significa che più lo si utilizza, meno errori commette, avvicinandosi gradualmente all'accuratezza umana nelle sue risposte. Non è perfetto, ma è progettato per imparare da ogni interazione.
  • Apprendimento per rinforzo. Un tipo di apprendimento automatico in cui un modello di IA apprende ricevendo ricompense o penalità per le sue azioni, proprio come gli esseri umani acquisiscono abilità attraverso l'esperienza. Il sistema è addestrato per massimizzare i risultati positivi attraverso tentativi ed errori, migliorando le sue capacità decisionali.

Queste tecniche aiutano a ridurre le risposte errate, note come allucinazioni, utilizzando più fasi di convalida e adattandosi in modo più efficace attraverso l'autovalutazione e l'apprendimento continui.

Al fine di rendere le risposte di Grok più naturali e pertinenti, gli sviluppatori hanno introdotto dei circuiti di feedback umano (un metodo di addestramento in cui gli esseri umani valutano l'accuratezza, la pertinenza e l'utilità dei contenuti generati artificialmente) e un addestramento contestuale (che insegna al bot a considerare le interazioni precedenti, l'intenzione dell'utente e le informazioni circostanti per generare risposte più accurate e pertinenti).

Le caratteristiche uniche di Grok

Mentre la maggior parte dei modelli di IA mantiene un tono formale (e spesso sembra robotico), Grok 3 si distingue per il suo stile audace e ironico. Non ha paura di usare umorismo, sarcasmo e frasi non convenzionali. Grok dà la priorità a risposte fattuali e imparziali, spesso mettendo in discussione le narrazioni popolari. Mentre altre reti neurali evitano di discutere argomenti complessi, Grok adotta un approccio diverso. Non ha paura di discutere di filosofia, politica o dilemmi etici. Grok è in grado di considerare più punti di vista e persino di ammettere quando non è sicuro, una sincerità rara tra i chatbot. Questo fa sì che Grok sembri un interlocutore piuttosto che un generico dispositivo di risposta automatica.

In che modo Grok 3 può aiutarti?

Grok 3 è utile per agricoltori, imprenditori, autisti e creatori di contenuti.

Grok è stato creato con l'obiettivo di fornire risposte il più possibile utili e veritiere. Il bot eccelle nel gestire domande complesse o aperte. Mentre molti chatbot sono ottimi nel fornire informazioni rapide o risposte predefinite, Grok è progettato per affrontare domande complesse, specialmente in ambiti come la scienza e il pensiero critico. È in grado di scomporre argomenti intricati, come la meccanica quantistica o i dilemmi etici, in spiegazioni comprensibili senza banalizzarli. Questo lo rende uno strumento indispensabile per gli utenti che desiderano risposte più approfondite, che siano studenti, ricercatori o semplici curiosi.

Inoltre, gli utenti notano che questo bot censura le sue risposte molto meno di ChatGPT o Claude. Tuttavia, Grok dispone di protocolli di sicurezza per impedire istruzioni dannose o illegali, come la costruzione di una bomba. Se glielo chiedeste, il bot eluderebbe la domanda, magari spiegando la scienza degli esplosivi in modo generico e non istruttivo o dicendo: “Non facciamo esplodere cose; che ne dite di esplorare qualcosa di meno... combustibile?”. Questo bilancia l'apertura con la responsabilità, a differenza di alcuni chatbot che potrebbero interrompere completamente la conversazione o fornire risposte eccessivamente vaghe.

Il futuro di Grok

Elon Musk ha menzionato in un livestream che Grok 3 includerà presto una modalità vocale, in cui gli utenti potranno conversare con il chatbot Grok attraverso comandi vocali e ricevere risposte vocali generate dall'IA. Con l'introduzione della modalità vocale in Grok 3, gli utenti sperimenteranno un modo più naturale e interattivo di interagire con l'IA, sfumando i confini tra la comunicazione umana e quella artificiale.

Funzionalità premium, come DeepSearch, Think mode e Big Brain mode, saranno disponibili per un pubblico più ampio. DeepSearch è il motore di ricerca di Grok. È progettato per accedere alle ultime notizie in tempo reale, sintetizzare le informazioni chiave, ragionare su fatti e opinioni contrastanti e distillare chiarezza dalla complessità. Think mode fornisce un approccio a catena di pensiero alle richieste dell'utente. Il risultato è una descrizione dettagliata passo dopo passo del ragionamento del modello. È adatto a domande complesse che richiedono un ragionamento logico accurato, come problemi matematici, domande filosofiche o spiegazioni tecniche. La modalità Big Brain è una modalità più espansiva, creativa o computazionalmente intensiva che sfrutta un contesto più ampio, un riconoscimento avanzato dei modelli o una base di conoscenze più vasta. È ideale per affrontare domande sfaccettate o aperte, generare idee innovative o collegare punti tra domini diversi. Questa modalità può simulare un livello più elevato di astrazione o intuizione.

Per quanto riguarda l'hardware, il supercomputer Colossus di xAI è il sistema di addestramento dell'intelligenza artificiale più grande e potente al mondo. Costruito in soli 122 giorni, più velocemente di quanto chiunque avesse previsto, inizialmente funzionava con 100.000 GPU Nvidia H100.

La costruzione del Colossus

Tempo di costruzione: 122 giorni

In soli 92 giorni, xAI ha raddoppiato la propria capacità portandola a 200.000 GPU grazie all'integrazione dei nuovi e più potenti chip Blackwell H200 di Nvidia. Questo enorme aumento di potenza è solo l'inizio. xAI prevede di scalare Colossus fino a 1 milione di chip, aprendo la strada a futuri modelli Grok ancora più potenti e rivoluzionari. Le future iterazioni di Grok potrebbero essere in grado di gestire flussi di dati video, audio e in tempo reale.

Man mano che queste tecnologie si evolvono, hanno il potenziale per trasformare i settori industriali, migliorare l'apprendimento ed espandere la nostra conoscenza collettiva in modi che stiamo solo iniziando a comprendere. Il percorso di Grok da chatbot basato su testo a entità multimodale e interattiva in tempo reale è una testimonianza del rapido ritmo dell'innovazione nell'IA e promette un futuro entusiasmante per gli utenti, gli sviluppatori e la comunità tecnologica in generale.

Grok 4 dovrebbe essere rilasciato entro la fine del 2025.