Claude: Anthropic'i uuendusliku tehisintellekti lähemalt uurides

Anthropic'i juturobot Claude on üks ChatGPT peamistest konkurentidest. See ettevõte ei pruugi olla nii tuntud kui OpenAI, kuid see on edukas ja hästi rahastatud. Viimase paari aasta jooksul investeeris Amazon Anthropicusse 4 miljardit dollarit ja novembris 2024 teatasid nad uuest investeeringust veel 4 miljardit dollarit, mis teeb kokku 8 miljardit dollarit. Mis puutub Claude'i, siis inimesed kiidavad juturobotit selle inimlikkuse, loovuse, tundlikkuse ja emotsionaalse intelligentsuse eest. Selles artiklis vaatleme Claude'i juturobot'i ajalugu, selle aluspõhimõtteid, eeliseid ja piiranguid.

Claude'i päritolu

Anthropic on Dario Amodei ja tema õe Daniela Amodei kaasasutajad. Enne ettevõtte asutamist töötasid nad mõlemad OpenAIs: Dario oli teadusuuringute asepresident ja juhtis selliste mõjukate mudelite nagu GPT-2 ja GPT-3 loomist, Daniela aga ohutuse ja poliitika asepresident.

Dario ja Daniela Amodei

Miks Dario Amodei OpenAI-st lahkus? Mõned allikad väidavad, et ta lahkus, kuna ta oli mures, et OpenAI seab üha enam esikohale midagi muud kui eetilise tehisintellekti arendamist. Ja siin on see, mida Dario ise ütleb:

„Seal on palju valeinformatsiooni. Inimesed ütlevad, et me lahkusime, sest meile ei meeldinud kokkulepe Microsoftiga. Vale.“ Tegelik põhjus lahkumiseks on tema sõnul see, et „on uskumatult ebaproduktiivne püüda vaielda kellegi teise nägemuse vastu“. Nii et OpenAIsse jäämise asemel ütles Amodei endale: „Võtke mõned inimesed, keda te usaldate, ja minge oma visiooni ellu viima.“

Nii moodustasid Dario, Daniela ja mõned teised endised OpenAI töötajad 2021. aastal Anthropic'i, et realiseerida oma nägemus tehisintellektist. Märtsis 2023 andsid nad välja esimese versiooni Claude'i keelemudelist. Nimi on eelkõige inspireeritud Ameerika matemaatikust, teadlasest ja leiutajast Claude Shannonist, keda tuntakse kui „infoteooria isa“ ja „infoajastu isa“.

Claude Shannon

Claude'i põhimõtted ja väärtused

Ettevõtte missiooniks on uurida tehisintellekti mudelite ohutust, sisemist toimimist ja ühiskondlikku mõju, tagades, et tehisintellektil oleks arenenud ja võimekamaks muutudes positiivne mõju ühiskonnale.

Dario Amodei:

Oleme püüdnud Claude'i projekteerimisel algusest peale silmas pidada ohutust ja juhitavust. Paljud meie esimesed kliendid on olnud ettevõtted, kes hoolivad väga sellest, et mudel ei teeks midagi ettearvamatut. Või mõtleb fakte välja. Üks peamisi ideid Claude'i taga on midagi, mida nimetatakse põhiseaduslikuks tehisintellektiks. Konstitutsiooniline tehisintellekt põhineb mudeli treenimisel, et see järgiks selgesõnalisi põhimõtteid. Nii saab olla läbipaistvam selle suhtes, mida mudel teeb. Ja see muudab mudeli kontrollimise ja turvaliseks muutmise lihtsamaks.

Mis on konstitutsiooniline tehisintellekt? See on meetod abivalmis, ausa ja kahjutu tehisintellekti assistendi koolitamiseks enesetäiendamise kaudu, ilma et inimene tuvastaks kahjulikke väljundeid.

See protsess hõlmab kahte etappi - juhendatud õppimise ja tugevdava õppimise etappi:

Järelevalvefaasis võetakse proovid esialgsest mudelist, genereeritakse enesekriitika ja parandused ning algset mudelit häälestatakse parandatud vastuste põhjal.
Tugevdamise õppimise etapis hinnatakse täpsustatud mudeli valimeid ja treenitakse AI eelistuste andmekogumi põhjal eelistuste mudelit. Eelistusmudelit kasutatakse seejärel tehisintellekti assistendi treenimiseks premeerimissignaalina.

Nagu on näha graafikust, annab see lähenemisviis paremaid tulemusi võrreldes tavapärase inimese tagasisidest lähtuva tugevdusõppe (RLFH) meetodiga, mida kasutatakse teiste keelemudelite treenimiseks. See tähendab, et Claude ütleb vähem kahjulikke asju ja käitub harvemini halvasti kui teised juturobotid.

Konstitutsiooniline RL vs. standardne RLHF

Ainus inimlik järelevalve toimub erinevatest allikatest, näiteks ÜRO inimõiguste deklaratsioonist või DeepMindi Sparrow põhimõtetest laenatud reeglite või põhimõtete loetelu kaudu. Selle kohta saate rohkem teada siin: https://www.anthropic.com/news/claudes-constitution

Claude'i omadused ja praegused mudelid

Tavaliselt hinnatakse tehisintellekti süsteeme selle põhjal, kuidas nad sooritavad võrdlusuuringuid - standardiseeritud teste, mida tehakse mudelitele, et määrata kindlaks, kui võimekad nad on kodeerimises, matemaatilistele küsimustele vastamises või muudes ülesannetes. Nende näitajate järgi on Claude'i uusimad versioonid ligikaudu võrreldavad OpenAI ja Google'i kõige võimsamate mudelitega.

Claude 3.5 vs. teised mudelid võrdlusuuringutes

Kuid Claude'i tapjaomadus - tema emotsionaalne intelligentsus - ei ole midagi, mida saab kergesti mõõta. Inimesed ütlevad, et Claude on lihtsalt teistsugune. Loovam ja empaatilisem. Mõistlikum ja vähem närviliselt robootiline. Nad ütlevad, et Claude'i väljundid sarnanevad vastustega, mida annaks arukas ja tähelepanelik inimene, ja vähem nagu teiste juturobotite genereeritud proosa.

Arendajad toovad välja järgmised juturobotiga seotud positiivsed aspektid:

Claude on turvaline, sest ta pakub juurdepääsu AWSi ja GCP kaudu, SOC 2 Type II sertifikaati ja HIPAA nõuetele vastavuse võimalusi, järgides rangeid turvatavasid.
Claude on usaldatav, sest see ühendab endas klassi parimat vanglakindlust ja väärkasutuse vältimist.
Claude on usaldusväärne, sest tal on väga madal hallutsemise määr ja väga suur täpsus, isegi pikkade dokumentidega töötades.

Praeguste Claude'i mudelite võrdlus:

Mudel	Claude 3.5 Sonnet	Claude 3.5 Haiku	Claude 3 Opus	Claude 3 Sonnet	Claude 3 Haiku
Kirjeldus	Kõige intelligentsem mudel	Kiireim mudel	Võimas mudel väga keeruliste ülesannete jaoks	Intelligentsuse ja kiiruse tasakaal	Kiireim ja kõige kompaktsem mudel peaaegu kohese reageerimisvõime saavutamiseks
Tugevused	Kõrgeim intelligentsuse ja võimekuse tase	Intelligentsus ülikiiresti	Tipptasemel intelligentsus, sujuvus ja arusaamine	Tugev kasulikkus, mis on tasakaalustatud mastaapseks kasutuselevõtuks	Kiire ja täpne sihipärane jõudlus
Mitmekeelne	Jah	Jah	Jah	Jah	Jah
Visioon	Jah	Ei	Jah	Jah	Jah
Võrreldav latentsus	Kiire	Kiireim	Mõõdukalt kiire	Kiire	Kiireim
Konteksti aken	200K tokenid	200K tokenid	200K tokenid	200K tokenid	200K tokenid
Maksimaalne väljund	8192 tokenit	8192 tokenit	4096 tokenit	4096 tokenit	4096 tokenit
Koolitusandmete katkestamine	Aprill 2024	Juuli 2024	August 2023	August 2023	August 2023

200K tokenit vastab ligikaudu 150K ingliskeelsele sõnale või 680K unikoodimärgile.

8192 tokenit vastab ligikaudu 6200 ingliskeelsele sõnale või 12-14 ühekohalisele leheküljele.

4096 tokenit vastab ligikaudu 3100 ingliskeelsele sõnale või 6-7 leheküljele ühes reas.

Kaks uuemat mudelit on Claude 3.5 Sonnet ja Claude 3.5 Haiku.

Claude 3.5 Sonnet on kõige võimsam ja intelligentsem mudel. See suudab mõista nüansirikkaid juhiseid ja konteksti, tunneb ära ja parandab oma vigu, võtab teavet välja visuaalsetest materjalidest, näiteks graafikutest, diagrammidest ja keerulistest skeemidest. Täiustatud arutlusvõime, suur kontekstiaken, madal hallutsemise määr ja kõigele lisaks soe, inimlik toon teevad Claude 3.5 Sonnetist ideaalse juturoboti küsimustele vastamiseks, dokumentide ja teadmusbaaside analüüsimiseks.

Claude 3.5 Haiku on kõige kiirem mudel. See hiilgab tõeliselt kõikjal, kus vajate kiiret reageerimisaega, olgu selleks siis klienditeenindus, suhtlusplatvormid, veebikeskkonnad, e-kaubandus või haridus. Claude 3.5 Haiku pakub kiireid ja täpseid koodisoovitusi, et kiirendada arendustegevust. See sobib ideaalselt tarkvarameeskondadele, kes soovivad lihtsustada kodeerimist ja suurendada tootlikkust. Claude 3.5 Haiku toetab ainult tekstisisendit, mis tähendab, et see ei saa töödelda visuaalseid andmeid.

Mida Claude saab teha: selle tugevad ja nõrgad küljed

Claude'i mudeliperekond pakub iga ülesande jaoks sobiva suurusega mudelit, mis pakub parimat kombinatsiooni kiirusest ja jõudlusest. Claude suudab sama hõlpsasti täita keerulisi kognitiivseid ülesandeid ja rutiinset andmetöötlust. Alates keerulisest keeletundmisest kuni kiire numbrite arvutamiseni on Claude'i mudelid teie abilised paljude erialaste ja isiklike vajaduste jaoks:

Transkribeerige ja analüüsige staatilisi kujutisi, alates käsitsi kirjutatud märkmetest ja graafikutest kuni fotodeni.
Tõlkige eri keelte vahel reaalajas, harjutage grammatikat ja looge mitmekeelset sisu.
Looge veebisaite HTML- ja CSS-keeles, muutke pilte struktureeritud JSON-andmeteks ja siluge keerulisi koodibaase.
Osalege loomulikes vestlustes ja andke üksikasjalikke, kergesti arusaadavaid vastuseid.
Tänu oma suurele kontekstiaknale saab Claude seedida suuremaid andmeid, analüüsida tervet raamatut või kritiseerida pikka esseed ühe korraga.

Toetatud dokumenditüübid:

PDF
DOCX
CSV
TXT
HTML
ODT
RTF
EPUB
JSON

Faili piirid:

30MB ühe faili kohta
Kuni 5 faili vestluse kohta

Tehnilised piirangud: Claude ei saa otsida teavet internetist, ei saa genereerida pilte, ei ole hääle režiimi.

Claude saab aru naljadest, sõnamängudest, vabandustest ja komplimentidest. Vestlusroboti erakordne kirjutamisoskus võimaldab tal koostada emotsionaalseid, inimesele sarnaseid lugusid.

Mõned inimesed kurdavad siiski, et juturobot on muutunud halvemaks kirjutamises, ja selle põhjuseks on Claude'i iseloom.

Tehisintellekti mudeleid arendavad ettevõtted treenivad neid üldiselt nii, et nad ei ütleks kahjulikke asju ja ei abistaks kahjulikes ülesannetes. Selle eesmärk on õpetada mudeleid käituma „kahjutuult“. Kuid kui me mõtleme nende inimeste iseloomule, keda me peame tõeliselt imetlusväärseks, ei mõtle me ainult kahju vältimisele. Me mõtleme neile, kes on maailma suhtes uudishimulikud, kes püüavad rääkida tõtt, ilma et nad oleksid ebasõbralikud, ja kes suudavad näha mingi küsimuse mitmeid külgi, ilma et nad muutuksid oma seisukohtades liiga enesekindlaks või ettevaatlikuks. Me mõtleme neile, kes on kannatlikud kuulajad, hoolikad mõtlejad, vaimukad vestluskaaslased ja paljud teised omadused, mida me seostame targa ja mitmekülgse inimesega.

Mõnikord käitub Claude arglikult, keeldudes vastamast tundlikele küsimustele. Arendajad on väga uhked selle üle, et botist on raske saada ebaseaduslikku teavet, näiteks kuidas raha võltsida või kuidas politsei eest varjuda. Kuid mõnikord lülitab Claude enesetsensuuri sisse ja peab täiesti kahjututele päringutele vastuseks loenguid. Näiteks keeldub bott kirjutamast naljakat lugu vallandamisest, sest „ei taha sobimatu huumoriga kellegi tundeid haavata“; või võib viidata autoriõiguste rikkumisele, kui palutakse parodeerida kuulsat tegelast.

Redditi kasutajad teevad Claude'i üle nalja:

Mina: Tere; Claude: hakkab vabandama.

Kuid sellel tundlikkusel on ka hea külg - Anthropic kaitseb teie privaatsust väga hästi:

Privaatsuspoliitika: Võrdlus: ChatGPT vs Claude

Anthropic ei treeni oma mudeleid teie andmetega. Nad kustutavad kogu teie teabe automaatselt 30 päeva pärast ja te võite igal ajal eemaldada nende serveritest terveid vestlusi.

Kuidas inimesed Claude'i kasutavad

Claude suudab põhjalikult läbi vaadata ja mõista pikki juriidilisi dokumente, näiteks lepinguid või kohtuasjade toimikuid. Ja võttes selle aeganõudva ülesande enda peale, aitab Claude advokaatidel säästa oma väärtuslikku aega kõrgema taseme tööks. Seetõttu kasutab juriidilise tehnoloogia idufirma Robin AI Claude'i juriidiliste dokumentide analüüsimiseks.

Scribd, Inc. kasutab Claude'i, et luua kvaliteetsed metaandmed miljonitele kasutajate poolt üleslaetud dokumentidele, parandades sisu leitavust ja edendades kasutajate kaasamist oma ülemaailmsete platvormide kaudu.

Aitas lahendada 70% kasutajate poolt üleslaaditud sisust, millel puudusid kvaliteetsed metaandmed.
Rikkalikumad sisukirjeldused suurendasid märkimisväärselt kasutajate registreerumist ja tellimusi.
Skaaluti üle 100 miljoni dokumendi töötlemiseks.

Newfront on kaasaegne kindlustusplatvorm, mis kasutab Claude'i, et automatiseerida tüütuid kindlustusülesandeid ja pakkuda kohest tuge, muutes kindlustuse kõigile kättesaadavamaks ja tõhusamaks.

Tänu Claude'ile on Newfront:

Säästab personalimeeskonnad ühe kuu aastas ja pakub töötajatele 24/7 personaalset tuge.
Vähendab dokumentide töötlemise kulusid 60% võrra.
Pakub juriidilistele meeskondadele koheseid lepingute ülevaatusi.

Zapia aitab Ladina-Ameerika tarbijatel leida tooteid, teha oste ja saada tuge populaarsete sõnumirakenduste, näiteks WhatsAppi kaudu.

Claude'i abil on Zapia:

Kasvas esimese aasta jooksul 2,5 miljoni kasutaja võrra.
Tekitas üle 90% positiivset tagasisidet kasutajatelt.
Käsitleb sadu tuhandeid sõnumeid tunnis.

Nagu näete, rõhutab Claude'i mitmekülgsus erinevates tööstusharudes selle ärilist potentsiaali. Ettevõtted kasutavad seda töövoogude jaoks alates müügist kuni tarkvaraarendamiseni. Automatiseerides korduvaid ülesandeid ja abistades sisu loomisel, võib Claude suurendada tootlikkust ja vabastada inimtöötajad, et nad saaksid keskenduda suurema väärtusega tööle.

Lisateave Claude'i klientide ja äriliste kasutusjuhtumite kohta leiate siit: https://www.anthropic.com/customers.

Statistika põhineb 1 miljonil juhuslikult valitud vestlusel:

10,4% - Veebi- ja mobiilirakenduste arendamine
9,2% - Sisu loomine ja kommunikatsioon
7,2% - Akadeemiline uurimistöö ja kirjutamine
7,1% - Haridus ja karjääriarendus
6,0% - Täiustatud tehisintellekt / masinõppe rakendused
5,7% - Äristrateegia ja operatsioonid
4,5% - Keeletõlge
3,9% - DevOps ja pilvepõhine infrastruktuur
3,7% - Digitaalne turundus ja SEO
3,5% - Andmeanalüüs ja visualiseerimine

Andmeid kogus Clio (Claude Insights and Observations), platvorm, mis annab ülevaate tehisintellekti kasutusmustritest, paljastades suundumusi ja käitumist, ilma et see kahjustaks üksikisiku privaatsust.

Rakenduste mitmekesisus ja märkimisväärsed kasutusmäärad eri kategooriates toovad esile, kuidas tehisintellektipõhised lahendused on muutumas üha levinumaks. See suundumus näitab selliste vahendite nagu Claude mitmekülgsust ja peegeldab tehisintellekti kasvavat integreerimist meie töö- ja eraellu.