Claude: En nærmere titt på Anthropics innovative KI

Chatbot Claude fra Anthropic er en av ChatGPTs hovedkonkurrenter. Selskapet er kanskje ikke like kjent som OpenAI, men det er vellykket og velfinansiert. I løpet av de siste årene har Amazon investert 4 milliarder dollar i Anthropic, og i november 2024 kunngjorde de en ny investering på ytterligere 4 milliarder dollar, noe som bringer totalen til 8 milliarder dollar. Når det gjelder Claude, roser folk chatboten for sin medmenneskelighet, kreativitet, følsomhet og emosjonelle intelligens. I denne artikkelen vil vi se på historien til Claude chatbot, dens grunnleggende prinsipper, fordeler og begrensninger.

Claudes opprinnelse

Anthropic er grunnlagt av Dario Amodei og hans søster Daniela Amodei. Før de grunnla selskapet, jobbet de begge i OpenAI: Dario var visepresident for forskning og ledet etableringen av innflytelsesrike modeller som GPT-2 og GPT-3, mens Daniela var visepresident for sikkerhet og policy.

Dario og Daniela Amodei

Hvorfor forlot Dario Amodei OpenAI? Noen kilder sier at han sluttet fordi han var bekymret for at OpenAI i økende grad prioriterte alt annet enn etisk utvikling av kunstig intelligens. Og her er hva Dario selv sier:

«Det er mye feilinformasjon der ute. Folk sier at vi forlot selskapet fordi vi ikke likte avtalen med Microsoft. Det stemmer ikke.» Den egentlige grunnen til at vi sluttet, sa han, er at «det er utrolig uproduktivt å prøve å argumentere mot noen andres visjon.» Så i stedet for å bli i OpenAI, sa Amodei til seg selv: «Ta med deg noen mennesker du stoler på, og realiser visjonen din.»

Dario, Daniela og noen få andre tidligere OpenAI-ansatte dannet derfor Anthropic i 2021 for å realisere sin visjon om kunstig intelligens. I mars 2023 lanserte de den første versjonen av språkmodellen Claude. Navnet er inspirert av Claude Shannon, en amerikansk matematiker, vitenskapsmann og oppfinner som er kjent som «informasjonsteoriens far» og «informasjonsalderens far».

Claude Shannon

Claudes prinsipper og verdier

Selskapets oppgave er å undersøke sikkerheten, den indre virkemåten og den samfunnsmessige effekten av AI-modeller, for å sikre at kunstig intelligens har en positiv innvirkning på samfunnet etter hvert som den blir mer avansert og dyktig.

Dario Amodei:

Vi har forsøkt å designe Claude med tanke på sikkerhet og kontrollerbarhet helt fra begynnelsen. Mange av de første kundene våre har vært bedrifter som er svært opptatt av at modellen ikke skal gjøre noe uforutsigbart. Eller finner på fakta. En av de store ideene bak Claude er noe som kalles konstitusjonell KI. Konstitusjonell KI er basert på å trene opp modellen til å følge et eksplisitt sett med prinsipper. På den måten kan du være mer åpen om hva modellen gjør. Og dette gjør det enklere å kontrollere modellen og gjøre den trygg.

Hva er konstitusjonell KI? Det er en metode for å trene opp hjelpsomme, ærlige og ufarlige AI-assistenter gjennom selvforbedring uten at noen menneskelige etiketter identifiserer skadelige resultater.

Denne prosessen består av to faser: en fase med veiledet læring og en fase med forsterket læring:

I den overvåkede fasen samples en opprinnelig modell, det genereres selvkritikk og revisjoner, og den opprinnelige modellen finjusteres på grunnlag av de reviderte svarene.
I forsterkningslæringsfasen evalueres prøvene fra den finjusterte modellen, og en preferansemodell trenes opp fra datasettet med KI-preferanser. Preferansemodellen brukes deretter som belønningssignal for å trene opp KI-assistenten.

Som det fremgår av grafen, gir denne tilnærmingen bedre resultater sammenlignet med den konvensjonelle metoden Reinforcement learning from human feedback (RLFH), som brukes til å trene opp andre språkmodeller. Det betyr at det er mindre sannsynlig at Claude sier skadelige ting og oppfører seg mindre feil enn andre chatboter.

Konstitusjonell RL vs Standard RLHF

Det eneste menneskelige tilsynet skjer gjennom en liste med regler eller prinsipper som er lånt fra ulike kilder, for eksempel FNs menneskerettighetserklæring eller Sparrow Principles fra DeepMind. Du kan lese mer om dette her: https://www.anthropic.com/news/claudes-constitution

Claudes funksjoner og nåværende modeller

Vanligvis vurderes systemer for kunstig intelligens ut fra hvordan de presterer i referanseevalueringer - standardiserte tester som gis til modeller for å avgjøre hvor dyktige de er til å kode, svare på mattespørsmål eller andre oppgaver. Ut fra disse målene er de nyeste versjonene av Claude omtrent sammenlignbare med de kraftigste modellene fra OpenAI og Google.

Claude 3.5 sammenlignet med andre modeller i referanseindekser

Men Claudes viktigste egenskap - den emosjonelle intelligensen - er ikke noe som lett kan måles. Folk sier at Claude bare føles annerledes. Mer kreativ og empatisk. Mer innsiktsfull og mindre irriterende robotaktig. De sier at Claudes utspill ligner på svarene et smart, oppmerksomt menneske ville gitt, og mindre på den generiske prosaen som genereres av andre chatboter.

Utviklerne fremhever følgende positive aspekter ved chatboten:

Claude er sikker fordi den er tilgjengelig via AWS og GCP, SOC 2 Type II-sertifisering og HIPAA-samsvarsalternativer, og den følger strenge sikkerhetsrutiner.
Claude er troverdig fordi den kombinerer klassens beste jailbreak-motstand og forebygging av misbruk.
Claude er pålitelig fordi den kan skilte med svært lav hallusinasjonsrate og svært høy nøyaktighet, selv når den arbeider med lange dokumenter.

Sammenligning av nåværende Claude-modeller:

Modell	Claude 3.5 Sonnet	Claude 3.5 Haiku	Claude 3 Opus	Claude 3 Sonnet	Claude 3 Haiku
Beskrivelse	Den mest intelligente modellen	Raskeste modell	Kraftig modell for svært komplekse oppgaver	Balanse mellom intelligens og hurtighet	Den raskeste og mest kompakte modellen for nesten umiddelbar respons
Styrker	Høyeste nivå av intelligens og kapasitet	Intelligens i rasende fart	Intelligens, flyt og forståelse på toppnivå	Sterk nytteverdi, balansert for skalerte distribusjoner	Rask og nøyaktig målrettet ytelse
Flerspråklig	Ja	Ja	Ja	Ja	Ja
Visjon	Ja	Nei	Ja	Ja	Ja
Sammenlignende ventetid	Rask	Raskest	Moderat rask	Rask	Raskest
Kontekstvindu	200 000 tokens	200 000 tokens	200 000 tokens	200 000 tokens	200 000 tokens
Maks utgang	8192 tokens	8192 tokens	4096 tokens	4096 tokens	4096 tokens
Avskjæring av treningsdata	April 2024	Juli 2024	August 2023	August 2023	August 2023

200 000 tokens tilsvarer omtrent 150 000 engelske ord eller 680 000 Unicode-tegn.

8192 tokens tilsvarer omtrent 6200 engelske ord eller 12-14 sider med enkel linjeavstand.

4096 tokens tilsvarer omtrent 3100 engelske ord eller 6-7 sider med enkel linjeavstand.

To av de nyeste modellene heter Claude 3.5 Sonnet og Claude 3.5 Haiku.

Claude 3.5 Sonnet er den kraftigste og mest intelligente modellen. Den kan forstå nyanserte instruksjoner og kontekst, gjenkjenne og korrigere sine egne feil og trekke ut informasjon fra visuelle elementer som diagrammer, grafer og komplekse diagrammer. Forbedrede resonneringsevner, et stort kontekstvindu, lav hallusinasjonsrate og en varm, menneskelignende tone på toppen av det hele gjør Claude 3.5 Sonnet til en ideell chatbot for å svare på spørsmål, analysere dokumenter og kunnskapsbaser.

Claude 3.5 Haiku er den raskeste modellen. Den briljerer overalt der du trenger raske svartider, enten det gjelder kundeservice, sosiale plattformer, nettsamfunn, e-handel eller utdanning. Claude 3.5 Haiku gir raske, nøyaktige kodeforslag for å øke utviklingshastigheten. Det er perfekt for programvareteam som ønsker å forenkle kodingen og øke produktiviteten. Claude 3.5 Haiku støtter bare tekstinntasting, og kan derfor ikke behandle visuelle data.

Hva Claude kan gjøre: styrker og svakheter

Claude-familien har den rette størrelsen for enhver oppgave, og tilbyr den beste kombinasjonen av hastighet og ytelse. Claude kan utføre komplekse kognitive oppgaver og rutinemessig databehandling med like stor letthet. Claude-modellene er dine foretrukne assistenter for en lang rekke profesjonelle og personlige behov, fra sofistikert språkforståelse til rask tallbehandling:

Transkribering og analyse av statiske bilder, fra håndskrevne notater og grafer til fotografier.
Oversett mellom ulike språk i sanntid, øv på grammatikk og lag flerspråklig innhold.
Opprett nettsteder i HTML og CSS, gjør bilder om til strukturerte JSON-data og feilsøk komplekse kodebaser.
Delta i naturlige samtaler og gi detaljerte, lett forståelige svar.
Takket være det store kontekstvinduet kan Claude fordøye større datamengder, analysere en hel bok eller kritisere et langt essay på én gang.

Dokumenttyper som støttes:

PDF
DOCX
CSV
TXT
HTML
ODT
RTF
EPUB
JSON

Filbegrensninger:

30 MB per fil
Opptil 5 filer per chat

Tekniske begrensninger: Claude kan ikke søke etter informasjon på Internett, generere bilder og har ingen talemodus.

Claude forstår vitser, ordspill, unnskyldninger og komplimenter. Chatbotens eksepsjonelle skriveferdigheter gjør at den kan lage følelsesladde, menneskelignende historier.

Noen klager imidlertid over at chatboten har blitt dårligere til å skrive, og årsaken til dette er Claudes karakter.

Selskaper som utvikler KI-modeller, trener dem vanligvis opp til å unngå å si skadelige ting og til å unngå å hjelpe til med skadelige oppgaver. Målet med dette er å trene opp modeller til å oppføre seg på måter som er «ufarlige». Men når vi tenker på karakteren til dem vi virkelig synes er beundringsverdige, tenker vi ikke bare på å unngå skade. Vi tenker på dem som er nysgjerrige på verden, som streber etter å fortelle sannheten uten å være uvennlige, og som er i stand til å se mange sider av en sak uten å bli overmodige eller overdrevent forsiktige i sine synspunkter. Vi tenker på dem som er tålmodige lyttere, grundige tenkere, vittige samtalepartnere og mange andre egenskaper vi forbinder med det å være en klok og allsidig person.

Til tider opptrer Claude sky og nekter å svare på sensitive spørsmål. Utviklerne er veldig stolte av at det er vanskelig å hente ut ulovlig informasjon fra boten, for eksempel hvordan man forfalsker penger eller hvordan man gjemmer seg for politiet. Men noen ganger slår Claude på selvsensur og forelesninger som svar på helt ufarlige forespørsler. For eksempel nekter boten å skrive en morsom historie om å få sparken fordi den «ikke vil såre noens følelser med upassende humor», eller den kan påberope seg brudd på opphavsretten hvis den blir bedt om å parodiere en kjent karakter.

Reddit-brukere gjør narr av Claude:

Jeg: Hei; Claude: begynner å be om unnskyldning

Men det er en god side ved denne følsomheten - Anthropic beskytter personvernet ditt:

Retningslinjer for personvern: ChatGPT vs Claude

Anthropic trener ikke modellene sine på dataene dine. De sletter automatisk all informasjonen din etter 30 dager, og du kan fjerne hele chatter fra serverne deres når du vil.

Hvordan folk bruker Claude

Claude kan gå grundig gjennom og forstå lange juridiske dokumenter, for eksempel kontrakter eller saksmapper. Ved å ta seg av denne tidkrevende oppgaven hjelper Claude advokater med å spare verdifull tid til arbeid på et høyere nivå. Det er grunnen til at den nystartede juridiske teknologivirksomheten Robin AI bruker Claude til å analysere juridisk papirarbeid.

Scribd, Inc. bruker Claude til å generere metadata av høy kvalitet for millioner av brukeropplastede dokumenter, noe som gjør innholdet lettere å finne og øker brukerengasjementet på tvers av selskapets globale plattformer.

Bidro til å løse problemet med 70 % av det brukeropplastede innholdet som manglet metadata av høy kvalitet.
Rikere innholdsbeskrivelser førte til betydelig flere brukerregistreringer og abonnementer.
Skalert til å behandle over 100 millioner dokumenter.

Newfront, en moderne forsikringsplattform, bruker Claude til å automatisere kjedelige forsikringsoppgaver og gi øyeblikkelig støtte, noe som gjør forsikring mer tilgjengelig og effektiv for alle.

Med Claude kan Newfront

Sparer HR-teamene for en måned i året og gir de ansatte personlig støtte døgnet rundt.
Reduserer dokumentbehandlingskostnadene med 60 %.
Gir umiddelbar kontraktsgjennomgang for juridiske team.

Zapia hjelper latinamerikanske forbrukere med å oppdage produkter, foreta kjøp og få support gjennom populære meldingsapper som WhatsApp.

Ved å bruke Claude har Zapia

Vokste med 2,5 millioner brukere i løpet av det første året.
Generert over 90 % positive tilbakemeldinger fra brukerne.
Håndterer hundretusener av meldinger i timen.

Som du kan se, viser Claudes allsidighet på tvers av bransjer det kommersielle potensialet. Bedrifter bruker det i arbeidsflyter innen alt fra salg til programvareutvikling. Ved å automatisere repeterende oppgaver og hjelpe til med å skape innhold, kan Claude øke produktiviteten og frigjøre menneskelige medarbeidere til å fokusere på mer verdifullt arbeid.

Les mer om Claudes kunder og kommersielle brukstilfeller her: https://www.anthropic.com/customers

Statistikk basert på 1 million tilfeldig utvalgte chatter:

10,4 % - Utvikling av nett- og mobilapper
9,2 % - Innholdsproduksjon og kommunikasjon
7,2 % - Akademisk forskning og skriving
7,1 % - Utdanning og karriereutvikling
6,0 % - Avansert kunstig intelligens/maskinlæring
5,7 % - Forretningsstrategi og -drift
4,5 % - Språkoversettelse
3,9 % - DevOps og skyinfrastruktur
3,7 % - Digital markedsføring og SEO
3,5 % - Dataanalyse og visualisering

Dataene ble samlet inn av Clio (Claude Insights and Observations), en plattform som gir en oversikt over bruksmønstre for KI, og som avdekker trender og atferd uten å gå på akkord med personvernet.

Det store utvalget av bruksområder og de høye bruksratene på tvers av ulike kategorier viser at KI-drevne løsninger blir stadig mer vanlige. Denne trenden viser hvor allsidige verktøy som Claude er, og gjenspeiler den økende integrasjonen av KI i våre profesjonelle og personlige liv.