Claude: una mirada més propera a la IA innovadora d'Anthropic

Chatbot Claude d'Anthropic és un dels principals competidors de ChatGPT. Pot ser que l'empresa no sigui tan coneguda com OpenAI, però té èxit i està ben finançada. Durant els darrers anys, Amazon va invertir 4.000 milions de dòlars a Anthropic i, el novembre de 2024, van anunciar una nova inversió de 4.000 milions de dòlars més, que va elevar el total a 8.000 milions de dòlars. Pel que fa a Claude, la gent lloa el chatbot per la seva humanitat, creativitat, sensibilitat i intel·ligència emocional. En aquest article, veurem la història del chatbot de Claude, els seus principis fonamentals, avantatges i limitacions.

Els orígens de Claude

Anthropic és cofundat per Dario Amodei i la seva germana Daniela Amodei. Abans de fundar la seva empresa, tots dos van treballar a OpenAI: Dario era vicepresident d'investigació i va liderar la creació de models influents com GPT-2 i GPT-3, mentre que Daniela era vicepresidenta de seguretat i polítiques.

Dario i Daniela Amodei

Per què Dario Amodei va deixar OpenAI? Algunes fonts diuen que va marxar davant la preocupació que OpenAI prioritzés cada cop més qualsevol cosa que no sigui el desenvolupament d'intel·ligència artificial ètica. I això és el que diu el mateix Dario:

"Hi ha molta desinformació allà fora. La gent diu que vam marxar perquè no ens agradava l'acord amb Microsoft. Fals." El veritable motiu per marxar, va dir, és que "és increïblement improductiu intentar discutir amb la visió d'una altra persona". Així que en comptes de quedar-se a OpenAI, Amodei es va dir a si mateix: "Agafeu algunes persones en qui confieu i aneu a fer realitat la vostra visió".

Així que Dario, Daniela i uns quants antics empleats d'OpenAI van formar Anthropic el 2021 per fer realitat la seva visió de la intel·ligència artificial. El març de 2023 van llançar la primera versió del model de llenguatge Claude. El nom es va inspirar especialment en Claude Shannon, un matemàtic, científic i inventor nord-americà conegut com "el pare de la teoria de la informació" i "el pare de l'era de la informació".

Claude Shannon

Principis i valors de Claude

La missió de l'empresa és investigar la seguretat, el funcionament intern i l'impacte social dels models d'IA, assegurant que la intel·ligència artificial tingui un impacte positiu en la societat a mesura que esdevé més avançada i capaç.

Dario Amodei:

Hem intentat dissenyar Claude tenint en compte la seguretat i el control des del principi. Molts dels nostres primers clients han estat empreses que es preocupen molt, ja ho sabeu, d'assegurar-se que el model no faci res impredictible. O inventar fets. Una de les grans idees darrere de Claude és una cosa anomenada IA constitucional. La IA constitucional es basa en entrenar el model per seguir un conjunt explícit de principis. Així, podeu ser més transparent sobre el que fa el model. I això fa que sigui més fàcil controlar el model i fer-lo segur.

Què és la IA constitucional? És un mètode per formar un assistent d'IA útil, honest i inofensiu mitjançant la millora personal sense cap etiqueta humana que identifiqui els resultats nocius.

Aquest procés consta de dues fases una fase d'aprenentatge supervisat i una fase d'aprenentatge de reforç:

En la fase supervisada, es mostreja un model inicial, es generen autocrítiques i revisions i s'ajusta el model original a les respostes revisades.
A la fase d'aprenentatge de reforç, s'avaluen mostres del model ajustat i s'entrena un model de preferències a partir del conjunt de dades de preferències d'IA. A continuació, el model de preferències s'utilitza com a senyal de recompensa per entrenar l'assistent d'IA.

Com es pot veure al gràfic, aquest enfocament dóna millors resultats en comparació amb el mètode convencional d'aprenentatge de reforç a partir de feedback humà (RLFH) utilitzat per entrenar altres models lingüístics. Això vol dir que és menys probable que Claude digui coses perjudicials i es porti malament amb menys freqüència que altres chatbots.

RL constitucional vs RLHF estàndard

L'única supervisió humana es proporciona a través d'una llista de regles o principis manllevats de diverses fonts, com ara la Declaració dels Drets Humans de les Nacions Unides o els principis Sparrow de DeepMind. Podeu obtenir-ne més informació aquí: https://www.anthropic.com/news/claudes-constitution

Característiques de Claude i models actuals

Normalment, els sistemes d'intel·ligència artificial es jutgen en funció del seu rendiment a les avaluacions de referència: proves estandarditzades donades als models per determinar la capacitat que tenen per codificar, respondre preguntes de matemàtiques o altres tasques. Segons aquestes mètriques, les últimes versions de Claude són aproximadament comparables als models més potents d'OpenAI i Google.

Claude 3.5 vs altres models en benchmarks

Però la característica assassina de Claude, la seva intel·ligència emocional, no és una cosa que es pugui mesurar fàcilment. La gent diu que Claude se sent diferent. Més creatiu i empàtic. Més perspicaç i menys robòtic. Els resultats de Claude, diuen, són com les respostes que donaria un humà intel·ligent i atent, i menys com la prosa genèrica generada per altres chatbots.

Els desenvolupadors destaquen els següents aspectes positius del chatbot:

Claude és segur perquè ofereix accessibilitat mitjançant AWS i GCP, la certificació SOC 2 tipus II i les opcions de compliment HIPAA, seguint pràctiques de seguretat rigoroses.
Claude és de confiança perquè combina la millor resistència al jailbreak i la prevenció d'ús indeguts.
Claude és fiable, ja que té unes taxes d'al·lucinació molt baixes i una precisió molt alta, fins i tot quan es treballa amb documents llargs.

Comparació dels models Claude actuals:

Model	Claude 3.5 Sonnet	Claude 3.5 Haiku	Claude 3 Opus	Claude 3 Sonnet	Claude 3 Haiku
Descripció	El model més intel·ligent	El model més ràpid	Model potent per a tasques molt complexes	Equilibri d'intel·ligència i velocitat	El model més ràpid i compacte per a una resposta gairebé instantània
Punts forts	Màxim nivell d'intel·ligència i capacitat	Intel·ligència a velocitats fulgurants	Intel·ligència, fluïdesa i comprensió de primer nivell	Utilitat forta, equilibrada per a desplegaments a escala	Rendiment objectiu ràpid i precís
Multilingüe	Sí	Sí	Sí	Sí	Sí
Visió	Sí	No	Sí	Sí	Sí
Latència comparativa	Ràpid	El més ràpid	Moderadament ràpid	Ràpid	El més ràpid
Finestra de context	200.000 tokens	200.000 tokens	200.000 tokens	200.000 tokens	200.000 tokens
Sortida màxima	8192 tokens	8192 tokens	4096 tokens	4096 tokens	4096 tokens
Tall de dades d'entrenament	Abril 2024	Juliol 2024	Agost 2023	Agost 2023	Agost 2023

200.000 tokens corresponen aproximadament a 150.000 paraules en anglès o 680.000 caràcters Unicode.

8192 tokens corresponen aproximadament a 6200 paraules en anglès o 12-14 pàgines a espai senzill.

4096 tokens corresponen aproximadament a 3100 paraules en anglès o 6-7 pàgines a espai senzill.

Dos dels models més nous s'anomenen Claude 3.5 Sonnet i Claude 3.5 Haiku.

Claude 3.5 Sonnet és el model més potent i intel·ligent. Pot comprendre instruccions i context matisats, reconèixer i corregir els seus propis errors, extreure informació d'elements visuals com gràfics, gràfics i diagrames complexos. Les capacitats de raonament millorades, una gran finestra de context, baixes taxes d'al·lucinació i un to càlid i humà a sobre de tot, fan de Claude 3.5 Sonnet un chatbot ideal per respondre preguntes, analitzar documents i bases de coneixement.

Claude 3.5 Haiku és el model més ràpid. Realment brilla allà on necessiteu temps de resposta ràpids, ja sigui en servei al client, plataformes socials, comunitats en línia, comerç electrònic o educació. Claude 3.5 Haiku ofereix suggeriments de codi ràpids i precisos per accelerar el desenvolupament. És perfecte per als equips de programari que volen simplificar la codificació i augmentar la productivitat. Claude 3.5 Haiku només admet l'entrada de text, és a dir, no pot processar dades visuals.

Què pot fer Claude: els seus punts forts i febles

La mida adequada per a qualsevol tasca, la família de models Claude ofereix la millor combinació de velocitat i rendiment. Claude pot realitzar tasques cognitives complexes i processar dades rutinàries amb la mateixa facilitat. Des d'una comprensió sofisticada de l'idioma fins a una ràpida compressió de números, els models Claude són els vostres assistents per a una àmplia gamma de necessitats professionals i personals:

Transcriure i analitzar imatges estàtiques, des de notes manuscrites i gràfics, fins a fotografies.
Tradueix entre diversos idiomes en temps real, practica la gramàtica i crea contingut multilingüe.
Creeu llocs web en HTML i CSS, convertiu les imatges en dades JSON estructurades i depureu bases de codi complexes.
Participa en converses naturals i proporciona respostes detallades i fàcils d'entendre.
A causa de la seva gran finestra de context, Claude pot digerir dades més grans, analitzar un llibre sencer o criticar un assaig llarg d'una vegada.

Tipus de documents admesos:

PDF
DOCX
CSV
TXT
HTML
ODT
RTF
EPUB
JSON

Límits dels fitxers:

30 MB per fitxer
Fins a 5 fitxers per xat

Limitacions tècniques: Claude no pot cercar informació a Internet, generar imatges, sense mode de veu.

Claude entén acudits, jocs de paraules, disculpes i compliments. Les excepcionals habilitats d'escriptura del chatbot li permeten crear històries emocionals i humanes.

Tanmateix, algunes persones es queixen que el chatbot s'ha empitjorat a l'hora d'escriure, i la raó d'això és el caràcter de Claude.

Les empreses que desenvolupen models d'IA generalment els entrenen per evitar dir coses perjudicials i per evitar ajudar amb tasques perjudicials. L'objectiu d'això és entrenar models perquè es comportin de manera "inofensiva". Però quan pensem en el caràcter d'aquells que considerem realment admirables, no pensem només en evitar el dany. Pensem en aquells que tenen curiositat pel món, que s'esforcen per dir la veritat sense ser cruels, i que són capaços de veure molts aspectes d'un tema sense arribar a ser massa confiats o massa cautelosos en les seves opinions. Pensem en aquells que escolten pacients, pensadors atents, conversadors enginyosos i molts altres trets que associem a ser una persona sàvia i completa.

De vegades, Claude actua tímidament, negant-se a respondre cap pregunta sensible. Els desenvolupadors estan molt orgullosos del fet que sigui difícil extreure informació il·legal del bot, com ara com falsificar diners o com amagar-se de la policia. Però de vegades Claude activa l'autocensura i dóna conferències en resposta a peticions completament inofensives. Per exemple, el bot es nega a escriure una història divertida sobre l'acomiadament perquè "no vol ferir els sentiments de ningú amb un humor inadequat"; o pot citar una infracció dels drets d'autor si se'ls demana que parodiï un personatge famós.

Els usuaris de Reddit es burlen de Claude:

Jo: Hola; Claude: comença a demanar perdó

Però hi ha un bon costat d'aquesta sensibilitat: Anthropic és molt protector de la vostra privadesa:

Polítiques de privadesa: ChatGPT vs Claude

Anthropic no entrena els seus models amb les vostres dades. Suprimeixen automàticament tota la vostra informació després de 30 dies i podeu eliminar xats sencers dels seus servidors quan vulgueu.

Com la gent utilitza Claude

Claude pot revisar i comprendre a fons documents legals llargs, com ara contractes o expedients. I en assumir aquesta tasca que requereix molt de temps, Claude ajuda els advocats a estalviar el seu valuós temps per a treballs de nivell superior. És per això que la startup de tecnologia legal Robin AI utilitza Claude per analitzar la documentació legal.

Scribd, Inc. utilitza Claude per generar metadades d'alta qualitat per a milions de documents penjats pels usuaris, millorant la descoberta del contingut i impulsant la participació dels usuaris a les seves plataformes globals.

Va ajudar a abordar el 70% del contingut penjat per l'usuari que no tenia metadades de qualitat.
Les descripcions de contingut més riques van augmentar significativament les inscripcions i les subscripcions dels usuaris.
Escalat per processar més de 100 milions de documents.

Newfront, una plataforma d'assegurances moderna, utilitza Claude per automatitzar tasques d'assegurança tedioses i proporcionar suport instantani, fent que l'assegurança sigui més accessible i eficient per a tothom.

Amb Claude, Newfront:

Estalvia els equips de recursos humans un mes a l'any i ofereix assistència personalitzada les 24 hores del dia als empleats.
Redueix els costos de processament de documents en un 60%.
Proporciona revisions instantànies de contractes per als equips legals.

Zapia ajuda els consumidors llatinoamericans a descobrir productes, fer compres i obtenir assistència mitjançant aplicacions de missatgeria populars com WhatsApp.

Utilitzant Claude, Zapia:

Va créixer en 2,5 milions d'usuaris en el seu primer any.
Va generar més d'un 90% de comentaris positius dels usuaris.
Gestiona centenars de milers de missatges per hora.

Com podeu veure, la versatilitat de Claude en diferents sectors destaca el seu potencial comercial. Les empreses l'estan implementant per a fluxos de treball, des de vendes fins al desenvolupament de programari. En automatitzar les tasques repetitives i ajudar amb la creació de contingut, Claude pot augmentar la productivitat i alliberar els treballadors humans per centrar-se en treballs de més valor.

Obteniu més informació sobre els clients de Claude i els casos d'ús comercial aquí: https://www.anthropic.com/customers

Estadístiques basades en 1 milió de xats seleccionats aleatòriament:

10,4% – Desenvolupament d'aplicacions web i mòbils
9,2% – Creació de continguts i comunicació
7,2% – Recerca acadèmica i redacció
7,1% – Educació i desenvolupament professional
6,0% – Intel·ligència artificial avançada / Aplicacions d'aprenentatge automàtic
5,7% – Estratègia i operacions empresarials
4,5% – Traducció lingüística
3,9% - DevOps i infraestructura de núvol
3,7% – Màrqueting digital i SEO
3,5% – Anàlisi i visualització de dades

Les dades van ser recollides per Clio (Claude Insights and Observations), una plataforma que ofereix una visió general dels patrons d'ús de la IA, revelant tendències i comportaments sense comprometre la privadesa individual.

L'àmplia varietat d'aplicacions i les taxes d'ús substancials en diferents categories posen de manifest com les solucions basades en IA són cada cop més habituals. Aquesta tendència mostra la versatilitat d'eines com Claude i reflecteix la creixent integració de la IA a la nostra vida professional i personal.