Claude: O privire mai atentă asupra IA inovatoare de la Anthropic

Chatbot Claude de la Anthropic este unul dintre principalii concurenți ai ChatGPT. Compania poate că nu este la fel de renumită ca OpenAI, dar este de succes și bine finanțată. În ultimii ani, Amazon a investit 4 miliarde de dolari în Anthropic, iar în noiembrie 2024, a anunțat o nouă investiție de încă 4 miliarde de dolari, ajungând la un total de 8 miliarde de dolari. În ceea ce îl privește pe Claude, oamenii laudă chatbotul pentru umanitatea, creativitatea, sensibilitatea și inteligența sa emoțională. În acest articol, vom analiza istoria chatbotului Claude, principiile sale fundamentale, avantajele și limitările.

Originile lui Claude

Anthropic este co-fondată de Dario Amodei și sora sa Daniela Amodei. Înainte de a-și înființa compania, ambii au lucrat la OpenAI: Dario a fost vicepreședinte pentru cercetare și a condus crearea unor modele influente precum GPT-2 și GPT-3, în timp ce Daniela a fost vicepreședinte pentru siguranță și politici.

Dario și Daniela Amodei

De ce a părăsit Dario Amodei OpenAI? Unele surse spun că a plecat din cauza îngrijorărilor legate de faptul că OpenAI prioritiza din ce în ce mai mult orice altceva în afară de dezvoltarea etică a inteligenței artificiale. Și iată ce spune însuși Dario:

„Există o mulțime de dezinformări. Oamenii spun că am plecat pentru că nu ne-a plăcut înțelegerea cu Microsoft. Fals”. Motivul real pentru care am plecat, a spus el, este că „este incredibil de neproductiv să încerci să te cerți cu viziunea altcuiva”. Așa că, mai degrabă decât să rămână la OpenAI, Amodei și-a spus: „Ia câțiva oameni în care ai încredere și du-te și realizează-ți viziunea.”

Astfel, Dario, Daniela și alți câțiva foști angajați OpenAI au format Anthropic în 2021 pentru a-și realiza viziunea asupra inteligenței artificiale. În martie 2023 au lansat prima versiune a modelului de limbaj Claude. Numele a fost inspirat în special de Claude Shannon, un matematician, om de știință și inventator american cunoscut drept „părintele teoriei informației” și „părintele erei informaționale”.

Claude Shannon

Principiile și valorile lui Claude

Misiunea companiei este de a investiga siguranța, funcționarea internă și impactul societal al modelelor de inteligență artificială, asigurându-se că inteligența artificială are un impact pozitiv asupra societății pe măsură ce devine mai avansată și mai capabilă.

Dario Amodei:

Am încercat de la început să îl proiectăm pe Claude ținând cont de siguranță și controlabilitate. Mulți dintre primii noștri clienți au fost întreprinderi cărora le pasă foarte mult, știți, să se asigure că modelul nu face nimic imprevizibil. Sau să inventeze fapte. Una dintre marile idei din spatele lui Claude este ceva numit IA constituțională. Inteligența artificială constituțională se bazează pe antrenarea modelului pentru a urma un set explicit de principii. Astfel, puteți fi mai transparenți cu privire la ceea ce face modelul. Astfel, este mai ușor să controlați modelul și să îl faceți mai sigur.

Ce este inteligența artificială constituțională? Este o metodă de formare a unui asistent IA util, onest și inofensiv prin autodepășire, fără ca etichetele umane să identifice rezultatele dăunătoare.

Acest proces implică două faze: o fază de învățare supravegheată și o fază de învățare prin consolidare:

În faza supravegheată, un model inițial este eșantionat, sunt generate autocritici și revizuiri, iar modelul inițial este ajustat în funcție de răspunsurile revizuite.
În faza de învățare prin consolidare, eșantioanele din modelul reglat sunt evaluate, iar un model de preferințe este format din setul de date privind preferințele IA. Modelul de preferințe este apoi utilizat ca semnal de recompensă pentru antrenarea asistentului IA.

După cum se poate observa în grafic, această abordare oferă rezultate mai bune în comparație cu metoda convențională de învățare prin consolidare din feedback uman (RLFH) utilizată pentru formarea altor modele lingvistice. Aceasta înseamnă că este mai puțin probabil ca Claude să spună lucruri dăunătoare și să se comporte urât mai rar decât alte chatbots.

RL constituțional vs RLHF standard

Singura supraveghere umană este asigurată printr-o listă de reguli sau principii împrumutate din diverse surse, cum ar fi Declarația ONU a Drepturilor Omului sau Principiile Sparrow de la DeepMind. Puteți afla mai multe despre aceasta aici: https://www.anthropic.com/news/claudes-constitution

Caracteristicile lui Claude și modelele actuale

De obicei, sistemele de inteligență artificială sunt judecate pe baza performanțelor obținute la evaluările de referință - teste standardizate aplicate modelelor pentru a determina cât de capabile sunt la codificare, răspunsuri la întrebări de matematică sau alte sarcini. Conform acestor parametri, cele mai recente versiuni ale lui Claude sunt aproximativ comparabile cu cele mai puternice modele de la OpenAI și Google.

Claude 3.5 vs alte modele în benchmark-uri

Dar trăsătura ucigașă a lui Claude - inteligența sa emoțională - nu este ceva ce poate fi măsurat cu ușurință. Oamenii spun că Claude se simte diferit. Mai creativ și mai empatic. Mai perspicace și mai puțin robotic. Ei spun că răspunsurile lui Claude seamănă cu răspunsurile pe care le-ar da un om inteligent și atent și mai puțin cu proza generică generată de alte chatbots.

Dezvoltatorii subliniază următoarele aspecte pozitive ale chatbotului:

Claude este sigur, deoarece oferă accesibilitate prin AWS și GCP, certificare SOC 2 de tip II și opțiuni de conformitate HIPAA, aderând la practici de securitate riguroase.
Claude este demn de încredere deoarece combină cea mai bună rezistență la jailbreak din clasa sa și prevenirea utilizării abuzive.
Claude este fiabil deoarece se mândrește cu rate foarte scăzute de halucinații și o precizie foarte ridicată, chiar și atunci când lucrează cu documente lungi.

Comparație între modelele Claude actuale:

Model	Claude 3.5 Sonnet	Claude 3.5 Haiku	Claude 3 Opus	Claude 3 Sonnet	Claude 3 Haiku
Descriere	Cel mai inteligent model	Cel mai rapid model	Model puternic pentru sarcini extrem de complexe	Echilibru între inteligență și viteză	Cel mai rapid și mai compact model pentru o reacție aproape instantanee
Puncte forte	Cel mai înalt nivel de inteligență și capacitate	Inteligență la viteze uriașe	Inteligență, fluență și înțelegere la nivel înalt	Utilitate puternică, echilibrată pentru implementări extinse	Performanță direcționată rapidă și precisă
Multilingv	Da	Da	Da	Da	Da
Viziune	Da	Nu	Da	Da	Da
Latență comparativă	Rapid	Cel mai rapid	Moderat de rapid	Rapid	Cel mai rapid
Fereastra contextuală	200K token-uri	200K token-uri	200K token-uri	200K token-uri	200K token-uri
Putere maximă	8192 token-uri	8192 token-uri	4096 token-uri	4096 token-uri	4096 token-uri
Tăierea datelor de formare	Aprilie 2024	Iulie 2024	August 2023	August 2023	August 2023

200K token-uri corespund aproximativ la 150K cuvinte englezești sau 680K caractere Unicode.

8192 token-uri corespund aproximativ la 6200 de cuvinte în limba engleză sau 12-14 pagini cu spațiere simplă.

4096 token-uri corespund aproximativ la 3100 de cuvinte englezești sau 6-7 pagini cu spațiere simplă.

Două dintre cele mai noi modele se numesc Claude 3.5 Sonnet și Claude 3.5 Haiku.

Claude 3.5 Sonnet este cel mai puternic și mai inteligent model. Acesta poate înțelege instrucțiuni și contexte nuanțate, recunoaște și își corectează propriile greșeli, extrage informații din elemente vizuale precum diagrame, grafice și diagrame complexe. Capacitățile de raționament îmbunătățite, o fereastră de context mare, ratele scăzute de halucinații și un ton cald, asemănător cu cel uman, pe lângă toate acestea, fac din Claude 3.5 Sonnet un chatbot ideal pentru a răspunde la întrebări, a analiza documente și baze de cunoștințe.

Claude 3.5 Haiku este cel mai rapid model. Acesta strălucește cu adevărat oriunde aveți nevoie de timpi rapizi de răspuns, fie în serviciul clienți, platforme sociale, comunități online, comerț electronic sau educație. Claude 3.5 Haiku oferă sugestii de cod rapide și precise pentru a accelera dezvoltarea. Este perfect pentru echipele de software care doresc să simplifice codarea și să crească productivitatea. Claude 3.5 Haiku acceptă doar introducerea de text, ceea ce înseamnă că nu poate procesa date vizuale.

Ce poate face Claude: punctele sale forte și slabe

De dimensiuni potrivite pentru orice sarcină, familia de modele Claude oferă cea mai bună combinație de viteză și performanță. Claude poate efectua cu aceeași ușurință sarcini cognitive complexe și procesarea de rutină a datelor. De la înțelegerea sofisticată a limbajului la calcularea rapidă a numerelor, modelele Claude sunt asistenții dvs. ideali pentru o gamă largă de nevoi profesionale și personale:

Transcrieți și analizați imagini statice, de la notițe scrise de mână și grafice, la fotografii.
Traduceți între diverse limbi în timp real, exersați gramatica și creați conținut multilingv.
Crearea de site-uri web în HTML și CSS, transformarea imaginilor în date JSON structurate și depanarea bazelor de cod complexe.
Implicați-vă în conversații naturale și oferiți răspunsuri detaliate, ușor de înțeles.
Datorită ferestrei sale uriașe de context, Claude poate digera bucăți mai mari de date, analizând o carte întreagă sau criticând un eseu lung dintr-o dată.

Tipuri de documente acceptate:

PDF
DOCX
CSV
TXT
HTML
ODT
RTF
EPUB
JSON

Limitele fișierelor:

30MB per fișier
Până la 5 fișiere pe chat

Limitări tehnice: Claude nu poate căuta informații pe Internet, nu poate genera imagini, nu are mod vocal.

Claude înțelege glumele, jocurile de cuvinte, scuzele și complimentele. Abilitățile excepționale de scriere ale chatbot-ului îi permit să creeze povești emoționante, asemănătoare celor umane.

Cu toate acestea, unii oameni se plâng că chatbotul a devenit mai slab la scris, iar motivul pentru aceasta este caracterul lui Claude.

Companiile care dezvoltă modele de inteligență artificială le antrenează, în general, pentru a evita să spună lucruri dăunătoare și pentru a evita să ajute la sarcini dăunătoare. Scopul este de a antrena modelele să se comporte în moduri care sunt „inofensive”. Dar când ne gândim la caracterul celor pe care îi considerăm cu adevărat admirabili, nu ne gândim doar la evitarea riscurilor. Ne gândim la cei care sunt curioși cu privire la lume, care se străduiesc să spună adevărul fără a fi răutăcioși și care sunt capabili să vadă mai multe părți ale unei probleme fără a deveni prea încrezători sau prea precauți în opiniile lor. Ne gândim la cei care ascultă cu răbdare, gândesc cu atenție, poartă conversații ingenioase și la multe alte trăsături pe care le asociem cu a fi o persoană înțeleaptă și bine pregătită.

Uneori, Claude acționează timid, refuzând să răspundă la întrebări delicate. Dezvoltatorii sunt foarte mândri de faptul că este dificil să extragi informații ilegale de la robot, cum ar fi cum să falsifici bani sau cum să te ascunzi de poliție. Dar, uneori, Claude pornește autocenzura și prelege ca răspuns la cereri complet inofensive. De exemplu, botul refuză să scrie o poveste amuzantă despre concedierea sa deoarece „nu vrea să rănească sentimentele nimănui cu un umor nepotrivit”; sau poate invoca încălcarea drepturilor de autor dacă i se cere să parodieze un personaj celebru.

Utilizatorii Reddit fac mișto de Claude:

Eu: Bună; Claude: începe să-și ceară scuze

Dar există și o parte bună a acestei sensibilități - Anthropic protejează foarte bine intimitatea dumneavoastră:

Politici de confidențialitate: ChatGPT vs Claude

Anthropic nu își antrenează modelele pe datele dumneavoastră. Ei șterg automat toate informațiile după 30 de zile și puteți elimina chat-uri întregi de pe serverele lor oricând doriți.

Cum îl folosesc oamenii pe Claude

Claude poate revizui și înțelege documente juridice lungi, cum ar fi contracte sau dosare. Și prin preluarea acestei sarcini consumatoare de timp, Claude îi ajută pe avocați să își păstreze timpul prețios pentru activități de nivel superior. Acesta este motivul pentru care startup-ul de tehnologie juridică Robin AI îl folosește pe Claude pentru a analiza documentele juridice.

Scribd, Inc. utilizează Claude pentru a genera metadate de înaltă calitate pentru milioane de documente încărcate de utilizatori, îmbunătățind descoperirea conținutului și stimulând implicarea utilizatorilor pe platformele sale globale.

A ajutat la soluționarea a 70% din conținutul încărcat de utilizatori care nu avea metadate de calitate.
Descrierile mai bogate ale conținutului au crescut semnificativ înscrierile și abonamentele utilizatorilor.
A fost scalat pentru a procesa peste 100 de milioane de documente.

Newfront, o platformă modernă de asigurări, utilizează Claude pentru a automatiza sarcinile de asigurare plictisitoare și pentru a oferi asistență instantanee, făcând asigurările mai accesibile și mai eficiente pentru toată lumea.

Cu Claude, Newfront:

Scapă echipele de resurse umane de o lună pe an și oferă suport personalizat 24/7 pentru angajați.
Reduce costurile de procesare a documentelor cu 60%.
Oferă revizuiri instantanee ale contractelor pentru echipele juridice.

Zapia ajută consumatorii din America Latină să descopere produse, să facă achiziții și să obțină asistență prin intermediul aplicațiilor de mesagerie populare, precum WhatsApp.

Prin utilizarea lui Claude, Zapia:

A crescut cu 2,5 milioane de utilizatori în primul an.
A generat peste 90% feedback pozitiv din partea utilizatorilor.
Gestionează sute de mii de mesaje pe oră.

După cum puteți vedea, versatilitatea lui Claude în toate industriile evidențiază potențialul său comercial. Companiile îl implementează pentru fluxuri de lucru de la vânzări la dezvoltarea de software. Prin automatizarea sarcinilor repetitive și asistarea la crearea de conținut, Claude poate crește productivitatea și poate elibera lucrătorii umani pentru a se concentra pe activități cu valoare adăugată mai mare.

Aflați mai multe despre clienții lui Claude și cazurile de utilizare comercială aici: https://www.anthropic.com/customers

Statistici bazate pe 1 milion de chat-uri selectate aleatoriu:

10,4% - Dezvoltare de aplicații web și mobile
9,2% - Creație de conținut și comunicare
7,2% - Cercetare academică și scriere
7,1% - Educație și dezvoltarea carierei
6,0% - Aplicații avansate de inteligență artificială / învățare automată
5,7% - Strategie și operațiuni de afaceri
4,5% - Traducerea limbilor străine
3,9% - DevOps și infrastructură cloud
3,7% - Marketing digital și SEO
3,5% - Analiza și vizualizarea datelor

Datele au fost colectate de Clio (Claude Insights and Observations), o platformă care oferă o imagine de ansamblu a modelelor de utilizare a IA, dezvăluind tendințe și comportamente fără a compromite confidențialitatea individuală.

Varietatea largă de aplicații și ratele substanțiale de utilizare în diferite categorii evidențiază modul în care soluțiile bazate pe IA devin din ce în ce mai frecvente. Această tendință demonstrează versatilitatea instrumentelor precum Claude și reflectă integrarea tot mai mare a IA în viața noastră profesională și personală.