Claude: Et nærmere kig på Anthropics innovative KI

Chatbot Claude fra Anthropic er en af ChatGPT's hovedkonkurrenter. Virksomheden er måske ikke så kendt som OpenAI, men den er succesfuld og velfinansieret. I løbet af de sidste par år har Amazon investeret 4 milliarder dollars i Anthropic, og i november 2024 annoncerede de en ny investering på yderligere 4 milliarder dollars, hvilket bringer det samlede beløb op på 8 milliarder dollars. Hvad Claude angår, roser folk chatbotten for dens menneskelighed, kreativitet, følsomhed og følelsesmæssige intelligens. I denne artikel vil vi se på Claudes chatbots historie, dens grundlæggende principper, fordele og begrænsninger.

Claudes oprindelse

Anthropic er grundlagt af Dario Amodei og hans søster Daniela Amodei. Før de grundlagde deres virksomhed, arbejdede de begge hos OpenAI: Dario var vicepræsident for forskning og stod i spidsen for oprettelsen af indflydelsesrige modeller som GPT-2 og GPT-3, mens Daniela var vicepræsident for sikkerhed og politik.

Dario og Daniela Amodei

Hvorfor forlod Dario Amodei OpenAI? Nogle kilder siger, at han forlod OpenAI på grund af bekymringer om, at OpenAI i stigende grad prioriterede alt andet end etisk udvikling af kunstig intelligens. Og her er, hvad Dario selv siger:

»Der er en masse misinformation derude. Folk siger, at vi gik, fordi vi ikke kunne lide aftalen med Microsoft. Det passer ikke.« Den egentlige grund til at forlade os, sagde han, er, at »det er utroligt uproduktivt at forsøge at argumentere mod en andens vision.« Så i stedet for at blive hos OpenAI sagde Amodei til sig selv: »Tag nogle mennesker, du stoler på, og få din vision til at ske.«

Så Dario, Daniela og et par andre tidligere OpenAI-medarbejdere dannede Anthropic i 2021 for at realisere deres vision om kunstig intelligens. I marts 2023 udgav de den første version af Claude-sprogmodellen. Navnet er især inspireret af Claude Shannon, en amerikansk matematiker, videnskabsmand og opfinder, der er kendt som »informationsteoriens fader« og »informationsalderens fader«.

Claude Shannon

Claudes principper og værdier

Virksomhedens mission er at undersøge sikkerheden, det indre arbejde og den samfundsmæssige indvirkning af KI-modeller for at sikre, at kunstig intelligens har en positiv indvirkning på samfundet, efterhånden som den bliver mere avanceret og dygtig.

Dario Amodei:

Vi har forsøgt at designe Claude med sikkerhed og styrbarhed i tankerne lige fra begyndelsen. Mange af vores tidlige kunder har været virksomheder, der går meget op i, du ved, at sikre, at modellen ikke gør noget uforudsigeligt. Eller opfinder fakta. En af de store ideer bag Claude er noget, der kaldes konstitutionel KI. Konstitutionel KI er baseret på at træne modellen til at følge et eksplicit sæt principper. Så man kan være mere gennemsigtig med hensyn til, hvad modellen gør. Og det gør det lettere at kontrollere modellen og gøre den sikker.

Hvad er konstitutionel KI? Det er en metode til at træne hjælpsomme, ærlige og harmløse KI-assistenter gennem selvforbedring uden nogen menneskelige etiketter, der identificerer skadelige output.

Denne proces involverer to faser - en overvåget læringsfase og en forstærkningslæringsfase:

I den overvågede fase indsamles en indledende model, der genereres selvkritik og revisioner, og den oprindelige model finjusteres på baggrund af de reviderede svar.
I forstærkningsindlæringsfasen evalueres prøver fra den finjusterede model, og en præferencemodel trænes ud fra datasættet med KI-præferencer. Præferencemodellen bruges derefter som belønningssignal til at træne KI-assistenten.

Som det fremgår af grafen, giver denne tilgang bedre resultater sammenlignet med den konventionelle Reinforcement learning from human feedback (RLFH)-metode, der bruges til at træne andre sprogmodeller. Det betyder, at Claude er mindre tilbøjelig til at sige skadelige ting og opfører sig mindre forkert end andre chatbots.

Konstitutionel RL vs Standard RLHF

Det eneste menneskelige tilsyn sker gennem en liste af regler eller principper, der er lånt fra forskellige kilder, såsom FN's Menneskerettighedserklæring eller Sparrow Principles fra DeepMind. Du kan læse mere om det her: https://www.anthropic.com/news/claudes-constitution

Claudes funktioner og nuværende modeller

Typisk bedømmes systemer med kunstig intelligens ud fra, hvordan de klarer sig i benchmark-evalueringer - standardiserede tests, der gives til modeller for at afgøre, hvor dygtige de er til at kode, besvare matematiske spørgsmål eller andre opgaver. På den måde er de seneste versioner af Claude nogenlunde sammenlignelige med de mest kraftfulde modeller fra OpenAI og Google.

Claude 3.5 i forhold til andre modeller i benchmarks

Men Claudes vigtigste egenskab - dens følelsesmæssige intelligens - er ikke noget, der let kan måles. Folk siger, at Claude bare føles anderledes. Mere kreativ og empatisk. Mere indsigtsfuld og mindre irriterende robotagtig. De siger, at Claudes output ligner de svar, som et klogt, opmærksomt menneske ville give, og ikke den generiske prosa, som andre chatbots genererer.

Udviklerne fremhæver følgende positive aspekter ved chatbotten:

Claude er sikker, fordi den tilbyder tilgængelighed via AWS og GCP, SOC 2 Type II-certificering og HIPAA-overensstemmelsesmuligheder, der overholder strenge sikkerhedspraksisser.
Claude er troværdig, fordi den kombinerer klassens bedste jailbreak-resistens og forebyggelse af misbrug.
Claude er pålidelig, fordi den har en meget lav hallucinationsrate og en meget høj nøjagtighed, selv når den arbejder med lange dokumenter.

Sammenligning af nuværende Claude-modeller:

Model	Claude 3.5 Sonnet	Claude 3.5 Haiku	Claude 3 Opus	Claude 3 Sonnet	Claude 3 Haiku
Beskrivelse	Den mest intelligente model	Hurtigste model	Kraftfuld model til meget komplekse opgaver	Balance mellem intelligens og hurtighed	Hurtigste og mest kompakte model til næsten øjeblikkelig respons
Styrker	Højeste niveau af intelligens og kapacitet	Intelligens ved lynhurtige hastigheder	Intelligens, flydende sprog og forståelse på højeste niveau	Stærk nytteværdi, afbalanceret til skalerede implementeringer	Hurtig og præcis målrettet præstation
Flersproget	Ja	Ja	Ja	Ja	Ja
Vision	Ja	Nej	Ja	Ja	Ja
Sammenlignende latenstid	Hurtig	Hurtigste	Moderat hurtig	Hurtig	Hurtigste
Kontekst-vindue	200K tokens	200K tokens	200K tokens	200K tokens	200K tokens
Maks. output	8192 tokens	8192 tokens	4096 tokens	4096 tokens	4096 tokens
Afskæring af træningsdata	April 2024	Juli 2024	August 2023	August 2023	August 2023

200K tokens svarer nogenlunde til 150K engelske ord eller 680K unicode-tegn.

8192 tokens svarer nogenlunde til 6200 engelske ord eller 12-14 sider med enkelt mellemrum.

4096 tokens svarer nogenlunde til 3100 engelske ord eller 6-7 sider med enkelt mellemrum.

To af de nyeste modeller hedder Claude 3.5 Sonnet og Claude 3.5 Haiku.

Claude 3.5 Sonnet er den mest kraftfulde og intelligente model. Den kan forstå nuancerede instruktioner og kontekst, genkende og rette sine egne fejl, udtrække information fra visuelle elementer som diagrammer, grafer og komplekse diagrammer. Forbedrede ræsonnementsmuligheder, et stort kontekstvindue, lav hallucinationsrate og en varm, menneskelignende tone gør Claude 3.5 Sonnet til en ideel chatbot til besvarelse af spørgsmål, analyse af dokumenter og vidensbaser.

Claude 3.5 Haiku er den hurtigste model. Den stråler overalt, hvor du har brug for hurtige svartider, uanset om det er i kundeservice, sociale platforme, onlinefællesskaber, e-handel eller uddannelse. Claude 3.5 Haiku giver hurtige, præcise kodeforslag for at fremskynde udviklingen. Den er perfekt til softwareteams, der ønsker at forenkle kodningen og øge produktiviteten. Claude 3.5 Haiku understøtter kun tekstinput, hvilket betyder, at den ikke kan behandle visuelle data.

Hvad Claude kan: dens styrker og svagheder

Claude-familien har den rette størrelse til enhver opgave og tilbyder den bedste kombination af hastighed og ydeevne. Claude kan udføre komplekse kognitive opgaver og rutinemæssig databehandling med samme lethed. Fra sofistikeret sprogforståelse til hurtig talbehandling - Claude-modellerne er dine foretrukne assistenter til en lang række professionelle og personlige behov:

Transskribering og analyse af statiske billeder, fra håndskrevne noter og grafer til fotografier.
Oversæt mellem forskellige sprog i realtid, øv dig i grammatik, og skab indhold på flere sprog.
Oprette hjemmesider i HTML og CSS, omdanne billeder til strukturerede JSON-data og fejlfinde i komplekse kodebaser.
Indgå i naturlige samtaler og give detaljerede, letforståelige svar.
På grund af det store kontekstvindue kan Claude fordøje større datamængder, analysere en hel bog eller kritisere et langt essay på én gang.

Understøttede dokumenttyper:

PDF
DOCX
CSV
TXT
HTML
ODT
RTF
EPUB
JSON

Filbegrænsninger:

30 MB pr. fil
Op til 5 filer pr. chat

Tekniske begrænsninger: Claude kan ikke søge efter information på internettet, generere billeder, ingen stemmefunktion.

Claude forstår vittigheder, ordspil, undskyldninger og komplimenter. Chatbottens enestående skrivefærdigheder gør det muligt for den at skabe følelsesladede, menneskelignende historier.

Nogle mennesker klager dog over, at chatbotten er blevet dårligere til at skrive, og årsagen til dette er Claudes karakter.

Virksomheder, der udvikler AI-modeller, træner dem generelt til at undgå at sige skadelige ting og til at undgå at hjælpe med skadelige opgaver. Målet er at træne modellerne til at opføre sig på måder, der er »harmløse«. Men når vi tænker på karakteren hos dem, vi finder virkelig beundringsværdige, tænker vi ikke kun på at undgå skade. Vi tænker på dem, der er nysgerrige på verden, som stræber efter at fortælle sandheden uden at være uvenlige, og som er i stand til at se mange sider af en sag uden at blive overmodige eller alt for forsigtige i deres synspunkter. Vi tænker på dem, der er tålmodige lyttere, omhyggelige tænkere, vittige samtalepartnere og mange andre træk, som vi forbinder med at være en klog og afrundet person.

Til tider opfører Claude sig sky og nægter at svare på følsomme spørgsmål. Udviklerne er meget stolte af, at det er svært at få ulovlige oplysninger ud af boten, f.eks. hvordan man forfalsker penge, eller hvordan man gemmer sig for politiet. Men nogle gange slår Claude selvcensur til og holder foredrag som svar på helt harmløse anmodninger. For eksempel nægter botten at skrive en sjov historie om at blive fyret, fordi den »ikke vil såre nogens følelser med upassende humor«; eller den kan henvise til krænkelse af ophavsretten, hvis den bliver bedt om at parodiere en berømt figur.

Reddit-brugere gør grin med Claude:

Mig: Hej; Claude: begynder at undskylde

Men der er en god side af denne følsomhed - Anthropic er meget beskyttende over for dit privatliv:

Politikker for beskyttelse af personlige oplysninger: ChatGPT vs Claude

Anthropic træner ikke sine modeller på dine data. De sletter automatisk alle dine oplysninger efter 30 dage, og du kan fjerne hele chats fra deres servere, når du vil.

Sådan bruger folk Claude

Claude kan grundigt gennemgå og forstå lange juridiske dokumenter, f.eks. kontrakter eller sagsakter. Og ved at påtage sig denne tidskrævende opgave hjælper Claude advokater med at spare deres værdifulde tid til arbejde på et højere niveau. Derfor bruger legal tech-startup' en Robin AI Claude til at analysere juridisk papirarbejde.

Scribd, Inc. bruger Claude til at generere metadata af høj kvalitet til millioner af brugeruploadede dokumenter, forbedre muligheden for at finde indhold og øge brugernes engagement på tværs af sine globale platforme.

Hjalp med at håndtere 70 % af det brugeruploadede indhold, der manglede metadata af høj kvalitet.
Righoldige indholdsbeskrivelser øgede brugernes tilmeldinger og abonnementer markant.
Skaleret til at behandle over 100 millioner dokumenter.

Newfront, en moderne forsikringsplatform, bruger Claude til at automatisere kedelige forsikringsopgaver og yde øjeblikkelig support, hvilket gør forsikring mere tilgængelig og effektiv for alle.

Med Claude kan Newfront:

Sparer HR-teams en måned om året og leverer 24/7 personlig support til medarbejderne.
Reducerer omkostningerne til dokumentbehandling med 60 %.
Giver øjeblikkelig kontraktgennemgang til juridiske teams.

Zapia hjælper latinamerikanske forbrugere med at opdage produkter, foretage køb og få support via populære besked-apps som WhatsApp.

Ved at bruge Claude kunne Zapia:

Vokset med 2,5 millioner brugere i løbet af det første år.
Genereret over 90 % positiv brugerfeedback.
Håndteret hundredtusindvis af beskeder i timen.

Som du kan se, fremhæver Claudes alsidighed på tværs af brancher dens kommercielle potentiale. Virksomheder bruger det til arbejdsgange fra salg til softwareudvikling. Ved at automatisere gentagne opgaver og hjælpe med at skabe indhold kan Claude øge produktiviteten og frigøre menneskelige medarbejdere til at fokusere på arbejde af højere værdi.

Læs mere om Claudes kunder og kommercielle use cases her: https://www.anthropic.com/customers

Statistik baseret på 1 million tilfældigt udvalgte chats:

10,4% - Udvikling af web- og mobilapps
9,2% - Skabelse af indhold og kommunikation
7,2% - Akademisk forskning og skrivning
7,1% - Uddannelse og karriereudvikling
6,0% - Avanceret kunstig intelligens / maskinlæringsapplikationer
5,7% - Forretningsstrategi og -drift
4,5% - Sprogoversættelse
3,9 % - DevOps og cloud-infrastruktur
3,7 % - Digital markedsføring og SEO
3,5 % - Dataanalyse og -visualisering

Dataene blev indsamlet af Clio (Claude Insights and Observations), en platform, der giver et overblik over KI-brugsmønstre og afslører tendenser og adfærd uden at gå på kompromis med den enkeltes privatliv.

Den brede vifte af applikationer og de betydelige brugsrater på tværs af forskellige kategorier fremhæver, hvordan KI-drevne løsninger bliver mere og mere almindelige. Denne tendens viser alsidigheden i værktøjer som Claude og afspejler den voksende integration af KI i vores professionelle og personlige liv.