Claude'as: atidesnis žvilgsnis į „Anthropic“ naujovišką dirbtinį intelektą

„Anthropic“ sukurtas pokalbių robotas ‚Claude‘ yra vienas iš pagrindinių ‚ChatGPT‘ konkurentų. Galbūt ši bendrovė nėra tokia garsi kaip „OpenAI“, tačiau ji yra sėkminga ir gerai finansuojama. Per pastaruosius kelerius metus „Amazon“ į „Anthropic“ investavo 4 mlrd. dolerių, o 2024 m. lapkritį paskelbė apie naują investiciją - dar 4 mlrd. dolerių, taigi iš viso 8 mlrd. dolerių. Kalbant apie Klodą, žmonės giria pokalbių robotą už jo žmogiškumą, kūrybiškumą, jautrumą ir emocinį intelektą. Šiame straipsnyje apžvelgsime pokalbių roboto „Claude“ istoriją, jo pagrindinius principus, privalumus ir apribojimus.

Claude ištakos

Kompanijos „Anthropic“ įkūrėjai yra Dario Amodei ir jo sesuo Daniela Amodei. Prieš įkurdami įmonę, jie abu dirbo „OpenAI“: Dario buvo mokslinių tyrimų viceprezidentas ir vadovavo tokių įtakingų modelių kaip GPT-2 ir GPT-3 kūrimui, o Daniela buvo saugos ir politikos viceprezidentė.

Dario ir Daniela Amodei

Kodėl Dario Amodei paliko „OpenAI“? Kai kurie šaltiniai teigia, kad jis pasitraukė dėl susirūpinimo, jog „OpenAI“ vis dažniau pirmenybę teikia ne etiškam dirbtinio intelekto kūrimui. Štai ką sako pats Dario:

„Yra daug klaidingos informacijos. Žmonės sako, kad pasitraukėme, nes mums nepatiko susitarimas su „Microsoft“. Tai netiesa.“ Tikroji pasitraukimo priežastis, pasak jo, yra ta, kad „neįtikėtinai neproduktyvu bandyti ginčytis su kieno nors kito vizija“. Todėl, užuot likęs „OpenAI“, Amodei sau pasakė: „Pasiimk keletą žmonių, kuriais pasitiki, ir eik įgyvendinti savo viziją.“

Taigi Dario, Daniela ir dar keli buvę „OpenAI“ darbuotojai 2021 m. įkūrė „Anthropic“, kad įgyvendintų savo dirbtinio intelekto viziją. 2023 m. kovą jie išleido pirmąją Claude kalbos modelio versiją. Pavadinimą ypač įkvėpė amerikiečių matematikas, mokslininkas ir išradėjas Klodas Šenonas (Claude Shannon), žinomas kaip „informacijos teorijos tėvas“ ir „informacijos amžiaus tėvas“.

Klodas Šenonas

Claude'o principai ir vertybės

Bendrovės misija - tirti dirbtinio intelekto modelių saugumą, vidinį veikimą ir poveikį visuomenei, užtikrinant, kad dirbtinis intelektas darytų teigiamą įtaką visuomenei, nes jis tampa vis pažangesnis ir pajėgesnis.

Dario Amodei:

Nuo pat pradžių stengėmės kurti „Claude“, atsižvelgdami į saugumą ir galimybę valdyti. Daugelis mūsų pirmųjų klientų buvo įmonės, kurioms labai svarbu, kad modelis nedarytų nieko nenuspėjamo. Arba išgalvoti faktus. Viena iš svarbiausių „Claude“ idėjų yra vadinamoji konstitucinė dirbtinio intelekto sistema. Konstitucinis dirbtinis intelektas grindžiamas modelio mokymu laikytis aiškių principų rinkinio. Taigi galite skaidriau suprasti, ką modelis daro. Taip lengviau kontroliuoti modelį ir užtikrinti jo saugumą.

Kas yra konstitucinis dirbtinis intelektas? Tai naudingo, sąžiningo ir nekenksmingo dirbtinio intelekto asistento mokymo metodas, kai jis tobulėja pats, be jokių žmogaus etikečių, nustatančių kenksmingus rezultatus.

Šis procesas apima du etapus - prižiūrimo mokymosi etapą ir pastiprinto mokymosi etapą:

Prižiūrimoje fazėje imamas pradinis modelis, generuojama savikritika ir patikslinimai, o pradinis modelis tikslinamas pagal patikslintus atsakymus.
Sustiprinto mokymosi etape vertinami patikslinto modelio pavyzdžiai ir iš dirbtinio intelekto preferencijų duomenų rinkinio mokomas preferencijų modelis. Tada preferencijų modelis naudojamas kaip atlygio signalas dirbtinio intelekto asistentui mokyti.

Kaip matyti iš grafiko, šis metodas duoda geresnių rezultatų, palyginti su įprastiniu pastiprinimo mokymosi iš žmogaus atsiliepimų (angl. Reinforcement learning from human feedback,RLFH) metodu, naudojamu kitiems kalbos modeliams mokyti. Tai reiškia, kad Klodas rečiau sako žalingus dalykus ir rečiau elgiasi netinkamai nei kiti pokalbių robotai.

Konstitucinis RL ir standartinis RLHF

Vienintelė žmogiškoji priežiūra vykdoma per taisyklių ar principų, pasiskolintų iš įvairių šaltinių, pavyzdžiui, JT Žmogaus teisių deklaracijos ar „DeepMind“ sukurtų „Sparrow Principles“, sąrašą. Daugiau apie tai galite sužinoti čia: https://www.anthropic.com/news/claudes-constitution

„Claude“ funkcijos ir dabartiniai modeliai

Paprastai dirbtinio intelekto sistemos vertinamos pagal tai, kaip joms sekasi atlikti lyginamuosius vertinimus - standartizuotus testus, kurie atliekami modeliams siekiant nustatyti, kaip jie geba koduoti, atsakyti į matematinius klausimus ar atlikti kitas užduotis. Pagal šiuos rodiklius naujausios „Claude“ versijos yra maždaug panašios į galingiausius „OpenAI“ ir „Google“ modelius.

„Claude 3.5“, palyginti su kitais modeliais lyginamuosiuose tyrimuose

Tačiau svarbiausia „Claude“ savybė - emocinis intelektas - nėra lengvai išmatuojama. Žmonės sako, kad „Claude“ tiesiog jaučiasi kitoks. Kūrybiškesnis ir empatiškesnis. Labiau įžvalgus ir ne toks įkyrus. Jie sako, kad „Claude“ atsakymai yra panašūs į atsakymus, kuriuos duotų protingas, atidus žmogus, ir mažiau panašūs į kitų pokalbių robotų generuojamą bendrinę prozą.

Kūrėjai pabrėžia šiuos teigiamus pokalbių roboto aspektus:

Claude yra saugus, nes siūlo prieigą per AWS ir GCP, SOC 2 II tipo sertifikavimą ir HIPAA atitikties galimybes, laikosi griežtos saugumo praktikos.
Claude yra vertas pasitikėjimo, nes jame derinamas geriausias savo klasėje atsparumas įsilaužimui ir piktnaudžiavimo prevencija.
Claude yra patikimas, nes pasižymi labai mažu haliucinacijų skaičiumi ir labai dideliu tikslumu, net ir dirbant su ilgais dokumentais.

Dabartinių „Claude“ modelių palyginimas:

Modelis	Claude 3.5 Sonnet	Claude 3.5 Haiku	Claude 3 Opus	Claude 3 Sonnet	Claude 3 Haiku
Aprašymas	Pažangiausias modelis	Greičiausias modelis	Galingas labai sudėtingų užduočių modelis	Protingumo ir greičio pusiausvyra	Greičiausias ir kompaktiškiausias modelis, užtikrinantis beveik greitą reakciją
Stipriosios pusės	Aukščiausias žvalgybos ir gebėjimų lygis	Didžiuliu greičiu veikiantis intelektas	Aukščiausio lygio intelektas, sklandumas ir supratimas	Stiprus naudingumas, subalansuotas mastelio diegimui	Greitas ir tikslus tikslinis veikimas
Daugiakalbis	Taip	Taip	Taip	Taip	Taip
Vizija	Taip	Ne	Taip	Taip	Taip
Lyginamasis vėlavimas	Greitai	Greičiausias	Vidutiniškai greitai	Greitai	Greičiausias
Konteksto langas	200 tūkst. tokenų	200 tūkst. tokenų	200 tūkst. tokenų	200 tūkst. tokenų	200 tūkst. tokenų
Didžiausia galia	8192 tokenų	8192 tokenų	4096 tokenų	4096 tokenų	4096 tokenų
Mokymo duomenų riba	2024 m. balandžio mėn.	2024 m. liepos mėn.	2023 m. rugpjūčio mėn.	2023 m. rugpjūčio mėn.	2023 m. rugpjūčio mėn.

200 tūkst. tokenų maždaug atitinka 150 tūkst. angliškų žodžių arba 680 tūkst. unikodo ženklų.

8192 tokenai maždaug atitinka 6200 angliškų žodžių arba 12-14 puslapių.

4096 tokenai maždaug atitinka 3100 angliškų žodžių arba 6-7 puslapius su vienu intervalu.

Du iš naujausių modelių vadinami „Claude 3.5 Sonnet“ ir „Claude 3.5 Haiku“.

Claude 3.5 Sonnet yra galingiausias ir pažangiausias modelis. Jis gali suprasti niuansuotus nurodymus ir kontekstą, atpažinti ir ištaisyti savo klaidas, išgauti informaciją iš vaizdinės medžiagos, pvz., diagramų, grafikų ir sudėtingų diagramų. Išplėstinės samprotavimo galimybės, didelis konteksto langas, mažas haliucinacijų lygis ir šiltas, žmogiškąjį toną primenantis skambesys, be viso to, „Claude 3.5 Sonnet“ yra idealus pokalbių robotas, skirtas atsakyti į klausimus, analizuoti dokumentus ir žinių bazes.

Claude 3.5 Haiku yra greičiausias modelis. Jis išties spindi visur, kur reikia greito atsakymo, nesvarbu, ar tai būtų klientų aptarnavimas, socialinės platformos, internetinės bendruomenės, e. prekyba, ar švietimas. Claude 3.5 Haiku teikia greitus ir tikslius kodo pasiūlymus, kurie pagreitina kūrimą. Jis puikiai tinka programinės įrangos komandoms, norinčioms supaprastinti kodavimą ir padidinti produktyvumą. Claude 3.5 Haiku palaiko tik tekstinę įvestį, t. y. negali apdoroti vaizdinių duomenų.

Ką gali padaryti „Claude“: jos stipriosios ir silpnosios pusės

Tinkamo dydžio bet kokiai užduočiai atlikti, „Claude“ šeimos modeliai siūlo geriausią greičio ir našumo derinį. „Claude“ gali vienodai lengvai atlikti sudėtingas pažintines užduotis ir įprastą duomenų apdorojimą. Nuo sudėtingo kalbos supratimo iki greito skaičių skaičiavimo - „Claude“ modeliai yra jūsų pagalbininkai įvairiems profesiniams ir asmeniniams poreikiams:

Perrašykite ir analizuokite statinius vaizdus - nuo ranka rašytų užrašų ir grafikų iki nuotraukų.
Realiuoju laiku verskite iš vienos kalbos į kitą, praktikuokite gramatiką ir kurkite daugiakalbį turinį.
Kurkite svetaines HTML ir CSS, paverskite vaizdus struktūrizuotais JSON duomenimis ir derinkite sudėtingas kodų bazes.
Dalyvaukite natūraliuose pokalbiuose ir pateikite išsamius, lengvai suprantamus atsakymus.
Dėl didžiulio konteksto lango „Claude“ gali suvirškinti didesnius duomenis, vienu ypu išanalizuoti visą knygą arba sukritikuoti ilgą esė.

Palaikomi dokumentų tipai:

PDF
DOCX
CSV
TXT
HTML
ODT
RTF
EPUB
JSON

Failų ribos:

30 MB vienam failui
Iki 5 failų per pokalbį

Techniniai apribojimai: Claude negali ieškoti informacijos internete, generuoti vaizdų, nėra balso režimo.

Claude supranta anekdotus, kalambūrus, atsiprašymus ir komplimentus. Išskirtiniai pokalbių roboto rašymo įgūdžiai leidžia jam kurti emocionalias, į žmogų panašias istorijas.

Tačiau kai kurie žmonės skundžiasi, kad pokalbių robotas tapo prastesnis rašytojas, o to priežastis - Klodo charakteris.

Įmonės, kuriančios dirbtinio intelekto modelius, paprastai juos moko vengti sakyti kenksmingus dalykus ir nepadėti atlikti kenksmingų užduočių. Taip siekiama išmokyti modelius elgtis „nekenksmingai“. Tačiau kai galvojame apie charakterį tų, kuriais iš tiesų žavimės, galvojame ne tik apie žalos vengimą. Mes galvojame apie tuos, kurie smalsiai pažįsta pasaulį, kurie stengiasi sakyti tiesą, nebūdami nemalonūs, ir kurie sugeba įžvelgti daugelį problemos pusių, netapdami pernelyg pasitikintys savo nuomone ar pernelyg atsargūs. Galvojame apie tuos, kurie kantriai klausosi, atidžiai mąsto, šmaikščiai bendrauja ir pasižymi daugeliu kitų bruožų, kurie siejami su išmintingo ir visapusiško žmogaus savybėmis.

Kartais Claude'as elgiasi nedrąsiai, atsisako atsakyti į bet kokius jautrius klausimus. Kūrėjai labai didžiuojasi tuo, kad iš boto sunku išgauti neteisėtą informaciją, pavyzdžiui, kaip padirbti pinigus arba kaip pasislėpti nuo policijos. Tačiau kartais Claude'as įjungia savicenzūrą ir dėsto atsakydamas į visiškai nekenksmingus prašymus. Pavyzdžiui, botas atsisako parašyti juokingą istoriją apie tai, kad buvo atleistas iš darbo, nes „nenori įžeisti kieno nors jausmų netinkamu humoru“; arba gali nurodyti autorių teisių pažeidimą, jei paprašomas parodijuoti garsų personažą.

Reddit vartotojai juokiasi iš Claude'o:

Aš: Sveiki; Claude: pradeda atsiprašinėti

Tačiau šis jautrumas turi ir gerąją pusę - „Anthropic“ labai saugo jūsų privatumą:

„Anthropic“ netreniruoja savo modelių pagal jūsų duomenis. Po 30 dienų jie automatiškai ištrina visą jūsų informaciją, o jūs galite bet kada pašalinti visus pokalbius iš jų serverių.

Kaip žmonės naudoja Claude

Claude gali kruopščiai peržiūrėti ir suprasti ilgus teisinius dokumentus, pavyzdžiui, sutartis ar bylas. Imdamasis šios daug laiko reikalaujančios užduoties, „Claude“ padeda teisininkams sutaupyti savo brangaus laiko aukštesnio lygio darbui. Štai kodėl teisinių technologijų startuolis „ Robin AI“ naudoja „Claude“ teisiniams dokumentams analizuoti.

„Scribd, Inc.“ naudoja „Claude“, kad sukurtų aukštos kokybės metaduomenis milijonams naudotojų įkeltų dokumentų, pagerintų turinio suradimo galimybes ir skatintų naudotojų įsitraukimą savo pasaulinėse platformose.

Padėjo išspręsti 70 % naudotojų įkelto turinio, kuriam trūko kokybiškų metaduomenų.
Turtingesni turinio aprašymai gerokai padidino naudotojų registracijų ir prenumeratų skaičių.
Padidinta iki daugiau nei 100 mln. dokumentų.

Šiuolaikinė draudimo platforma „Newfront“ naudoja „Claude“, kad automatizuotų nuobodžias draudimo užduotis ir suteiktų greitą pagalbą, todėl draudimas tampa prieinamesnis ir efektyvesnis visiems.

Naudodama „Claude“, „Newfront“:

Sutaupo vieną mėnesį per metus ir visą parą teikia asmeninę pagalbą darbuotojams.
60 % sumažina dokumentų tvarkymo išlaidas.
Teisininkų komandoms teikia momentines sutarčių peržiūras.

„Zapia“ padeda Lotynų Amerikos vartotojams atrasti produktus, pirkti ir gauti paramą naudojantis populiariomis žinučių programėlėmis, pvz., ‚WhatsApp‘.

Naudodama „Claude“, „Zapia“:

Per pirmuosius metus padaugėjo 2,5 mln. vartotojų.
Sulaukė daugiau nei 90 % teigiamų vartotojų atsiliepimų.
Per valandą apdoroja šimtus tūkstančių žinučių.

Kaip matote, „Claude“ universalumas įvairiose pramonės šakose išryškina jos komercinį potencialą. Įmonės jį diegia darbo srautams nuo pardavimų iki programinės įrangos kūrimo. Automatizuodamas pasikartojančias užduotis ir padėdamas kurti turinį, „Claude“ gali padidinti produktyvumą ir atlaisvinti žmogiškuosius darbuotojus, kad jie galėtų susitelkti į didesnės vertės darbą.

Sužinokite daugiau apie „Claude“ klientus ir komercinio naudojimo atvejus čia: https://www.anthropic.com/customers.

Statistika pagrįsta 1 mln. atsitiktinai atrinktų pokalbių:

10,4 % - Žiniatinklio ir mobiliųjų programėlių kūrimas
9,2 % - Turinio kūrimas ir komunikacija
7,2 % - akademiniai tyrimai ir rašymas
7,1 % - Švietimas ir karjeros vystymas
6,0% - Pažangios dirbtinio intelekto / mašininio mokymosi programos
5,7 % - Verslo strategija ir veikla
4,5 % - Kalbų vertimas
3,9 % - DevOps ir debesijos infrastruktūra
3,7 % - Skaitmeninė rinkodara ir SEO
3,5% - Duomenų analizė ir vizualizacija

Duomenis surinko „Clio“ (Claude Insights and Observations) - platforma, kurioje apžvelgiami dirbtinio intelekto naudojimo modeliai, atskleidžiamos tendencijos ir elgsena nepažeidžiant asmens privatumo.

Didelė taikomųjų programų įvairovė ir dideli naudojimo rodikliai įvairiose kategorijose rodo, kad dirbtiniu intelektu paremti sprendimai tampa vis labiau paplitę. Ši tendencija rodo tokių priemonių kaip „Claude“ universalumą ir atspindi didėjančią AI integraciją į mūsų profesinį ir asmeninį gyvenimą.