Torna alla pagina principale

Claude: uno sguardo ravvicinato all'innovativa intelligenza artificiale di Anthropic

Chatbot Claude di Anthropic è uno dei principali concorrenti di ChatGPT. L'azienda non sarà famosa come OpenAI, ma ha successo ed è ben finanziata. Negli ultimi anni, Amazon ha investito 4 miliardi di dollari in Anthropic e nel novembre 2024 ha annunciato un nuovo investimento di altri 4 miliardi di dollari, portando il totale a 8 miliardi. Per quanto riguarda Claude, le persone lodano il chatbot per la sua umanità, creatività, sensibilità e intelligenza emotiva. In questo articolo analizzeremo la storia del chatbot Claude, i suoi principi fondamentali, i vantaggi e i limiti.

Le origini di Claude

Anthropic è co-fondata da Dario Amodei e da sua sorella Daniela Amodei. Prima di fondare la loro azienda, entrambi hanno lavorato presso OpenAI: Dario è stato vicepresidente della ricerca e ha guidato la creazione di modelli influenti come GPT-2 e GPT-3, mentre Daniela è stata vicepresidente della sicurezza e delle politiche.

Dario e Daniela Amodei

Dario e Daniela Amodei

Perché Dario Amodei ha lasciato OpenAI? Alcune fonti sostengono che se ne sia andato per la preoccupazione che OpenAI desse sempre più priorità a tutto tranne che allo sviluppo etico dell'intelligenza artificiale. Ecco cosa dice lo stesso Dario:

“C'è molta disinformazione in giro. La gente dice che ce ne siamo andati perché non ci piaceva l'accordo con Microsoft. È falso”. Il vero motivo per cui ce ne siamo andati, ha detto, è che “è incredibilmente improduttivo cercare di discutere con la visione di qualcun altro”. Quindi, piuttosto che rimanere in OpenAI, Amodei si è detto: “Prendi delle persone di cui ti fidi e vai a realizzare la tua visione”.

Così Dario, Daniela e alcuni altri ex dipendenti di OpenAI hanno costituito Anthropic nel 2021 per realizzare la loro visione dell'intelligenza artificiale. Nel marzo 2023 hanno rilasciato la prima versione del modello linguistico Claude. Il nome si ispira in particolare a Claude Shannon, matematico, scienziato e inventore americano noto come “il padre della teoria dell'informazione” e “il padre dell'era dell'informazione”.

Claude Shannon

Claude Shannon

Principi e valori di Claude

La missione dell'azienda è quella di studiare la sicurezza, il funzionamento interno e l'impatto sociale dei modelli di IA, garantendo che l'intelligenza artificiale abbia un impatto positivo sulla società man mano che diventa più avanzata e capace.

Dario Amodei:

Fin dall'inizio abbiamo cercato di progettare Claude tenendo conto della sicurezza e della controllabilità. Molti dei nostri primi clienti sono state aziende che si preoccupano molto di assicurarsi che il modello non faccia nulla di imprevedibile. O che si inventi dei fatti. Una delle grandi idee alla base di Claude è una cosa chiamata AI costituzionale. L'intelligenza artificiale costituzionale si basa sull'addestramento del modello a seguire un insieme esplicito di principi. In questo modo è possibile essere più trasparenti su ciò che il modello sta facendo. In questo modo è più facile controllare il modello e renderlo sicuro.

Che cos'è l'IA costituzionale? È un metodo per addestrare un assistente AI utile, onesto e innocuo attraverso l'auto-miglioramento senza etichette umane che identifichino i risultati dannosi.

Questo processo prevede due fasi: una fase di apprendimento supervisionato e una fase di apprendimento per rinforzo:

  • Nella fase supervisionata, viene campionato un modello iniziale, vengono generate autocritiche e revisioni e il modello originale viene perfezionato sulla base delle risposte riviste.
  • Nella fase di apprendimento per rinforzo, vengono valutati i campioni del modello perfezionato e viene addestrato un modello di preferenze a partire dal set di dati delle preferenze dell'intelligenza artificiale. Il modello di preferenze viene quindi utilizzato come segnale di ricompensa per addestrare l'assistente AI.

Come si può vedere nel grafico, questo approccio dà risultati migliori rispetto al metodo convenzionale Reinforcement learning from human feedback (RLFH) utilizzato per addestrare altri modelli linguistici. Ciò significa che Claude ha meno probabilità di dire cose dannose e si comporta male meno frequentemente di altri chatbot.

RL costituzionale vs RLHF standard

RL costituzionale vs RLHF standard

L'unica supervisione umana è fornita da un elenco di regole o principi presi in prestito da varie fonti, come la Dichiarazione dei Diritti Umani delle Nazioni Unite o i Principi Sparrow di DeepMind. Per saperne di più, cliccate qui: https://www.anthropic.com/news/claudes-constitution

Le caratteristiche di Claude e i modelli attuali

In genere, i sistemi di intelligenza artificiale vengono giudicati in base al loro rendimento nelle valutazioni di benchmark, ovvero test standardizzati somministrati ai modelli per determinare la loro capacità di codificare, rispondere a domande di matematica o ad altri compiti. In base a questi parametri, le ultime versioni di Claude sono più o meno paragonabili ai modelli più potenti di OpenAI e Google.

Claude 3.5 rispetto ad altri modelli nei benchmark

Claude 3.5 rispetto ad altri modelli nei benchmark

Ma la caratteristica principale di Claude, la sua intelligenza emotiva, non è facilmente misurabile. La gente dice che Claude si sente semplicemente diverso. Più creativo ed empatico. Più perspicace e meno robotico. Le risposte di Claude sono simili a quelle che darebbe un essere umano intelligente e attento e meno alla prosa generica generata da altri chatbot.

Gli sviluppatori sottolineano i seguenti aspetti positivi del chatbot:

  • Claude è sicuro perché offre l'accessibilità tramite AWS e GCP, la certificazione SOC 2 di tipo II e le opzioni di conformità HIPAA, aderendo a pratiche di sicurezza rigorose.
  • Claude è attendibile perché combina la migliore resistenza al jailbreak e la prevenzione dell'uso improprio.
  • Claude è affidabile perché vanta tassi di allucinazione molto bassi e una precisione molto elevata, anche quando si lavora con documenti lunghi.

Confronto tra gli attuali modelli di Claude:

ModelloClaude 3.5 SonnetClaude 3.5 HaikuClaude 3 OpusClaude 3 SonnetClaude 3 Haiku
DescrizioneIl modello più intelligenteModello più veloceModello potente per compiti altamente complessiEquilibrio tra intelligenza e velocitàIl modello più veloce e compatto per una reattività quasi istantanea
Punti di forzaMassimo livello di intelligenza e capacitàIntelligenza a velocità elevatissimeIntelligenza, fluidità e comprensione di alto livelloUtilità forte, bilanciata per implementazioni scalariPrestazioni mirate rapide e precise
Multilingua
VisioneNo
Latenza comparativaVeloceIl più veloceModeratamente veloceVeloceIl più veloce
Finestra di contesto200K token200K token200K token200K token200K token
Uscita massima8192 token8192 token4096 token4096 token4096 token
Taglio dei dati di allenamentoAprile 2024Luglio 2024Agosto 2023Agosto 2023Agosto 2023

200K token corrispondono all'incirca a 150K parole inglesi o 680K caratteri unicode.

8192 token corrispondono all'incirca a 6200 parole inglesi o a 12-14 pagine a spaziatura singola.

4096 token corrispondono all'incirca a 3100 parole inglesi o a 6-7 pagine a spaziatura singola.

Due dei modelli più recenti si chiamano Claude 3.5 Sonnet e Claude 3.5 Haiku.

Claude 3.5 Sonnet è il modello più potente e intelligente. È in grado di comprendere istruzioni e contesti sfumati, di riconoscere e correggere i propri errori, di estrarre informazioni da immagini come tabelle, grafici e diagrammi complessi. Capacità di ragionamento avanzate, un'ampia finestra di contesto, bassi tassi di allucinazione e un tono caldo e simile a quello umano fanno di Claude 3.5 Sonnet un chatbot ideale per rispondere a domande, analizzare documenti e basi di conoscenza.

Claude 3.5 Haiku è il modello più veloce. Si distingue ovunque sia necessario un tempo di risposta rapido, sia nel servizio clienti, che nelle piattaforme sociali, nelle comunità online, nell'e-commerce o nell'istruzione. Claude 3.5 Haiku fornisce suggerimenti di codice rapidi e accurati per accelerare lo sviluppo. È perfetto per i team di software che desiderano semplificare la codifica e aumentare la produttività. Claude 3.5 Haiku supporta solo l'immissione di testo, quindi non può elaborare dati visivi.

Cosa può fare Claude: i suoi punti di forza e di debolezza

La famiglia di modelli Claude offre la migliore combinazione di velocità e prestazioni. Claude è in grado di svolgere compiti cognitivi complessi e di elaborare dati di routine con la stessa facilità. Dalla comprensione sofisticata del linguaggio alla rapida elaborazione dei numeri, i modelli Claude sono i vostri assistenti preferiti per un'ampia gamma di esigenze professionali e personali:

  • Trascrivere e analizzare immagini statiche, da appunti e grafici scritti a mano a fotografie.
  • Tradurre tra varie lingue in tempo reale, esercitarsi con la grammatica e creare contenuti multilingue.
  • Creare siti web in HTML e CSS, trasformare le immagini in dati strutturati JSON ed eseguire il debug di basi di codice complesse.
  • Partecipare a conversazioni naturali e fornire risposte dettagliate e facilmente comprensibili.
  • Grazie all'ampia finestra contestuale, Claude può digerire grandi quantità di dati, analizzando un intero libro o criticando un lungo saggio in una sola volta.

Tipi di documenti supportati:

  • PDF
  • DOCX
  • CSV
  • TXT
  • HTML
  • ODT
  • RTF
  • EPUB
  • JSON

Limiti dei file:

  • 30MB per file
  • Fino a 5 file per chat

Limitazioni tecniche: Claude non può cercare informazioni su Internet, non può generare immagini, non può utilizzare la modalità vocale.

Claude comprende battute, giochi di parole, scuse e complimenti. Le eccezionali capacità di scrittura del chatbot gli consentono di creare storie emotive e simili a quelle umane.

Tuttavia, alcune persone si lamentano del fatto che il chatbot è diventato peggiore nella scrittura, e la ragione di ciò è il carattere di Claude.

Le aziende che sviluppano modelli di IA generalmente li addestrano a non dire cose dannose e a non assistere in compiti dannosi. L'obiettivo è addestrare i modelli a comportarsi in modo “innocuo”. Ma quando pensiamo al carattere di coloro che riteniamo veramente ammirevoli, non pensiamo solo all'evitamento del male. Pensiamo a coloro che sono curiosi del mondo, che si sforzano di dire la verità senza essere scortesi e che sono in grado di vedere molti lati di una questione senza diventare troppo sicuri di sé o troppo cauti nelle loro opinioni. Pensiamo a coloro che sono pazienti ascoltatori, attenti pensatori, arguti conversatori e molti altri tratti che associamo all'essere una persona saggia e a tutto tondo.

A volte Claude si comporta in modo timido, rifiutandosi di rispondere a domande delicate. Gli sviluppatori sono molto orgogliosi del fatto che sia difficile estrarre informazioni illegali dal bot, come ad esempio come contraffare denaro o come nascondersi dalla polizia. Ma a volte Claude si autocensura e fa la morale in risposta a richieste del tutto innocue. Ad esempio, il bot si rifiuta di scrivere una storia divertente sul licenziamento perché “non vuole ferire i sentimenti di nessuno con un umorismo inappropriato”; oppure può citare la violazione del copyright se gli viene chiesto di fare la parodia di un personaggio famoso.

Gli utenti di Reddit prendono in giro Claude:

Claude che si scusa

Io: ciao; Claude: inizia a scusarsi

Ma c'è un lato positivo in questa sensibilità: Anthropic è molto protettivo nei confronti della vostra privacy:

Politiche sulla privacy: ChatGPT vs Claude

Anthropic non addestra i suoi modelli sui vostri dati. Cancella automaticamente tutte le informazioni dopo 30 giorni e si possono rimuovere intere chat dai loro server in qualsiasi momento.

Come si usa Claude

Claude è in grado di esaminare e comprendere a fondo lunghi documenti legali, come contratti o fascicoli. Assumendo questo compito dispendioso, Claude aiuta gli avvocati a risparmiare tempo prezioso da dedicare a lavori di livello superiore. Ecco perché la startup Robin AI utilizza Claude per analizzare i documenti legali.

Scribd utilizza Claude

Scribd, Inc. utilizza Claude per generare metadati di alta qualità per milioni di documenti caricati dagli utenti, migliorando la scopribilità dei contenuti e favorendo il coinvolgimento degli utenti sulle sue piattaforme globali.

  • Ha aiutato a risolvere il 70% dei contenuti caricati dagli utenti che mancavano di metadati di qualità.
  • Descrizioni più ricche dei contenuti hanno aumentato significativamente le iscrizioni e le sottoscrizioni degli utenti.
  • Scalato per elaborare oltre 100 milioni di documenti.
Newfront utilizza Claude

Newfront, una moderna piattaforma assicurativa, utilizza Claude per automatizzare le attività assicurative più noiose e fornire assistenza immediata, rendendo l'assicurazione più accessibile ed efficiente per tutti.

Con Claude, Newfront:

  • Risparmia un mese all'anno ai team delle risorse umane e offre un'assistenza personalizzata ai dipendenti 24 ore su 24, 7 giorni su 7.
  • Riduce i costi di elaborazione dei documenti del 60%.
  • Fornisce revisioni istantanee dei contratti per i team legali.
Zapia utilizza Claude

Zapia aiuta i consumatori latinoamericani a scoprire i prodotti, a fare acquisti e a ricevere assistenza attraverso le più diffuse app di messaggistica come WhatsApp.

Utilizzando Claude, Zapia:

  • È cresciuta di 2,5 milioni di utenti nel primo anno.
  • Ha generato oltre il 90% di feedback positivi da parte degli utenti.
  • Gestisce centinaia di migliaia di messaggi all'ora.

Come si può notare, la versatilità di Claude nei vari settori evidenzia il suo potenziale commerciale. Le aziende lo utilizzano per flussi di lavoro che vanno dalle vendite allo sviluppo di software. Automatizzando le attività ripetitive e assistendo la creazione di contenuti, Claude può aumentare la produttività e liberare il personale umano per concentrarsi su lavori di maggior valore.

Per saperne di più sui clienti e sui casi d'uso commerciali di Claude: https://www.anthropic.com/customers

Statistiche basate su 1 milione di chat selezionate a caso:

Uso di Claude
  • 10,4% - Sviluppo di applicazioni web e mobili
  • 9,2% - Creazione di contenuti e comunicazione
  • 7,2% - Ricerca accademica e scrittura
  • 7,1% - Istruzione e sviluppo della carriera
  • 6,0% - Applicazioni avanzate di intelligenza artificiale/apprendimento automatico
  • 5,7% - Strategia e operazioni aziendali
  • 4,5% - Traduzione linguistica
  • 3,9% - DevOps e infrastruttura cloud
  • 3,7% - Marketing digitale e SEO
  • 3,5% - Analisi e visualizzazione dei dati

I dati sono stati raccolti da Clio (Claude Insights and Observations), una piattaforma che fornisce una panoramica dei modelli di utilizzo dell'AI, rivelando tendenze e comportamenti senza compromettere la privacy individuale.

L'ampia varietà di applicazioni e i notevoli tassi di utilizzo nelle diverse categorie evidenziano come le soluzioni basate sull'IA stiano diventando sempre più comuni. Questa tendenza evidenzia la versatilità di strumenti come Claude e riflette la crescente integrazione dell'IA nella nostra vita professionale e personale.