Claude: Anthropicin innovatiivinen tekoäly lähempää tarkastelua

Anthropicin tekemä Chatbot Claude on yksi ChatGPT:n tärkeimmistä kilpailijoista. Yritys ei ehkä ole yhtä tunnettu kuin OpenAI, mutta se on menestynyt ja hyvin rahoitettu. Viime vuosina Amazon on sijoittanut Anthropiciin 4 miljardia dollaria, ja marraskuussa 2024 se ilmoitti uudesta 4 miljardin dollarin investoinnista, joka nostaa kokonaismäärän 8 miljardiin dollariin. Claudea kehutaan sen inhimillisyydestä, luovuudesta, herkkyydestä ja tunneälystä. Tässä artikkelissa tarkastelemme Clauden chatbotin historiaa, sen perusperiaatteita, etuja ja rajoituksia.

Clauden alkuperä

Anthropicin ovat perustaneet Dario Amodei ja hänen siskonsa Daniela Amodei. Ennen yrityksensä perustamista he työskentelivät molemmat OpenAI:ssa: Dario oli tutkimuksen varajohtaja ja johti GPT-2:n ja GPT-3:n kaltaisten vaikutusvaltaisten mallien luomista, kun taas Daniela oli turvallisuuden ja politiikan varajohtaja.

Dario ja Daniela Amodei

Miksi Dario Amodei lähti OpenAI:sta? Joidenkin lähteiden mukaan hän lähti, koska hän oli huolissaan siitä, että OpenAI:n etusijalla oli yhä enemmän kaikkea muuta kuin eettinen tekoälyn kehittäminen. Ja tässä on, mitä Dario itse sanoo:

”Siellä on paljon väärää tietoa. Ihmiset sanovat, että lähdimme, koska emme pitäneet sopimuksesta Microsoftin kanssa. Se on väärin.” Todellinen syy lähtöön on hänen mukaansa se, että ”on uskomattoman tuottamatonta yrittää kiistellä jonkun toisen näkemyksen kanssa”. Sen sijaan, että Amodei olisi jäänyt OpenAI:n palvelukseen, hän sanoi itselleen: ”Ota mukaan ihmisiä, joihin luotat, ja mene toteuttamaan oma visiosi.”

Niinpä Dario, Daniela ja muutama muu entinen OpenAI:n työntekijä perustivat Anthropicin vuonna 2021 toteuttaakseen visionsa tekoälystä. Maaliskuussa 2023 he julkaisivat ensimmäisen version Clauden kielimallista. Nimi on saanut inspiraationsa erityisesti Claude Shannonista, yhdysvaltalaisesta matemaatikosta, tiedemiehestä ja keksijästä, joka tunnetaan ”informaatioteorian isänä” ja ”informaatioajan isänä”.

Claude Shannon

Clauden periaatteet ja arvot

Yrityksen tehtävänä on tutkia tekoälymallien turvallisuutta, sisäistä toimintaa ja yhteiskunnallisia vaikutuksia ja varmistaa, että tekoälyllä on myönteinen vaikutus yhteiskuntaan sen kehittyessä ja kehittyessä.

Dario Amodei:

Olemme yrittäneet suunnitella Clauden alusta alkaen turvallisuutta ja hallittavuutta silmällä pitäen. Monet ensimmäisistä asiakkaistamme ovat olleet yrityksiä, jotka pitävät paljon huolta siitä, että malli ei tee mitään arvaamatonta. Tai keksii tosiasioita. Yksi Clauden suurista ideoista on niin sanottu perustuslaillinen tekoäly. Konstitutionaalinen tekoäly perustuu siihen, että malli koulutetaan noudattamaan tiettyjä periaatteita. Näin voit olla avoimempi sen suhteen, mitä malli tekee. Näin mallia on helpompi hallita ja tehdä siitä turvallinen.

Mitä on perustuslaillinen tekoäly? Se on menetelmä, jonka avulla voidaan kouluttaa hyödyllisiä, rehellisiä ja vaarattomia tekoälyavustajia itsensä kehittämisen avulla ilman, että haitalliset tuotokset tunnistetaan ihmisleimojen avulla.

Tähän prosessiin kuuluu kaksi vaihetta, valvottu oppimisvaihe ja vahvistusoppimisvaihe:

Valvotussa vaiheessa otetaan näytteitä alkuperäisestä mallista, luodaan itsekritiikkiä ja tarkistuksia, ja alkuperäistä mallia hienosäädetään tarkistettujen vastausten perusteella.
Vahvistusoppimisvaiheessa hienosäädetyn mallin näytteitä arvioidaan ja mieluumminmalli koulutetaan tekoälymielipiteiden tietokannasta. Mieltymysmallia käytetään sitten palkitsemissignaalina tekoälyavustajan kouluttamisessa.

Kuten kaaviosta näkyy, tämä lähestymistapa antaa parempia tuloksia kuin perinteinen vahvistusoppiminen ihmisen palautteesta (Reinforcement learning from human feedback, RLFH), jota käytetään muiden kielimallien kouluttamiseen. Tämä tarkoittaa, että Claude sanoo vähemmän todennäköisesti haitallisia asioita ja käyttäytyy huonosti harvemmin kuin muut chatbotit.

Perustuslaillinen RL vs Standard RLHF

Ainoa inhimillinen valvonta tapahtuu eri lähteistä, kuten YK:n ihmisoikeuksien julistuksesta tai DeepMindin Sparrow-periaatteista, lainattujen sääntöjen tai periaatteiden avulla. Voit tutustua siihen tarkemmin täällä: https://www.anthropic.com/news/claudes-constitution

Clauden ominaisuudet ja nykyiset mallit

Yleensä tekoälyjärjestelmiä arvioidaan sen perusteella, miten ne suoriutuvat vertailuarvioinneista - standardoiduista testeistä, joita tehdään malleille sen määrittämiseksi, miten hyvin ne pystyvät koodaamaan, vastaamaan matemaattisiin kysymyksiin tai muihin tehtäviin. Näillä mittareilla Clauden uusimmat versiot ovat suunnilleen verrattavissa OpenAI:n ja Googlen tehokkaimpiin malleihin.

Claude 3.5 vs. muut mallit vertailuarvoissa

Clauden tappava ominaisuus - tunneäly - ei kuitenkaan ole helposti mitattavissa. Ihmiset sanovat, että Claude vain tuntuu erilaiselta. Luovampi ja empaattisempi. Oivaltavampi ja vähemmän robottimainen. He sanovat, että Clauden tuotokset ovat kuin vastauksia, joita älykäs ja tarkkaavainen ihminen antaisi, eivätkä niinkään muiden chat-robottien tuottamaa geneeristä proosaa.

Kehittäjät korostavat seuraavia chatbotin myönteisiä puolia:

Claude on turvallinen, koska se tarjoaa pääsyn AWS:n ja GCP:n kautta, SOC 2 Type II -sertifioinnin ja HIPAA-vaatimustenmukaisuusvaihtoehdot, jotka noudattavat tiukkoja turvallisuuskäytäntöjä.
Claude on uskottava, koska siinä yhdistyvät luokkansa paras jailbreak-kestävyys ja väärinkäytön estäminen.
Claude on luotettava, koska sen hallusinaatioasteet ovat erittäin alhaiset ja tarkkuus on erittäin korkea myös pitkien asiakirjojen kanssa työskenneltäessä.

Nykyisten Claude-mallien vertailu:

Malli	Claude 3.5 Sonnet	Claude 3.5 Haiku	Claude 3 Opus	Claude 3 Sonnet	Claude 3 Haiku
Kuvaus	Älykkäin malli	Nopein malli	Tehokas malli erittäin monimutkaisiin tehtäviin	Älykkyyden ja nopeuden tasapaino	Nopein ja pienikokoisin malli lähes välittömään reagointikykyyn
Vahvuudet	Korkeimman tason älykkyys ja valmiudet	Älykkyys hurjalla nopeudella	Huipputason älykkyys, sujuvuus ja ymmärrys	Vahva hyödyllisyys, tasapainoinen skaalautuville käyttöönotoille	Nopea ja tarkka kohdennettu suorituskyky
Monikielinen	Kyllä	Kyllä	Kyllä	Kyllä	Kyllä
Visio	Kyllä	Ei	Kyllä	Kyllä	Kyllä
Vertailukelpoinen viive	Nopea	Nopein	Kohtalaisen nopea	Nopea	Nopein
Konteksti-ikkuna	200 000 tokenia	200 000 tokenia	200 000 tokenia	200 000 tokenia	200 000 tokenia
Maksimiteho	8192 tokenia	8192 tokenia	4096 tokenia	4096 tokenia	4096 tokenia
Koulutusaineiston rajaus	Huhtikuu 2024	Heinäkuu 2024	Elokuu 2023	Elokuu 2023	Elokuu 2023

200 000 tokenia vastaa suunnilleen 150 000 englanninkielistä sanaa tai 680 000 unicode-merkkiä.

8192 tokenia vastaa karkeasti ottaen 6200 englanninkielistä sanaa tai 12-14 yksiruutuista sivua.

4096 tokenia vastaa suunnilleen 3100 englanninkielistä sanaa tai 6-7 sivua yhden rivin välein.

Kaksi uusinta mallia ovat Claude 3.5 Sonnet ja Claude 3.5 Haiku.

Claude 3.5 Sonnet on tehokkain ja älykkäin malli. Se pystyy ymmärtämään vivahteikkaita ohjeita ja asiayhteyksiä, tunnistamaan ja korjaamaan omia virheitään sekä poimimaan tietoa visuaalisista kuvista, kuten kaavioista, graafeista ja monimutkaisista kaavioista. Parannetut päättelyominaisuudet, suuri konteksti-ikkuna, alhainen harhojen määrä ja kaiken lisäksi lämmin, ihmismäinen ääni tekevät Claude 3.5 Sonnetista ihanteellisen chatbotin kysymyksiin vastaamiseen, asiakirjojen ja tietopankkien analysointiin.

Claude 3.5 Haiku on nopein malli. Se todella loistaa kaikkialla, missä tarvitset nopeita vastausaikoja, olipa kyse sitten asiakaspalvelusta, sosiaalisista alustoista, verkkoyhteisöistä, sähköisestä kaupankäynnistä tai koulutuksesta. Claude 3.5 Haiku tarjoaa nopeita ja tarkkoja koodiehdotuksia kehityksen nopeuttamiseksi. Se sopii täydellisesti ohjelmistotiimeille, jotka haluavat yksinkertaistaa koodausta ja lisätä tuottavuutta. Claude 3.5 Haiku tukee vain tekstinsyöttöä, eli se ei voi käsitellä visuaalista dataa.

Mitä Claude voi tehdä: sen vahvuudet ja heikkoudet

Claude-malliperhe on sopivan kokoinen kaikkiin tehtäviin, ja se tarjoaa parhaan yhdistelmän nopeutta ja suorituskykyä. Claude pystyy suorittamaan monimutkaisia kognitiivisia tehtäviä ja rutiininomaista tietojenkäsittelyä yhtä helposti. Hienostuneesta kielen ymmärtämisestä nopeaan numeronmurskaukseen Claude-mallit ovat parhaita avustajia monenlaisiin ammatillisiin ja henkilökohtaisiin tarpeisiin:

Transkriboi ja analysoi staattisia kuvia, käsinkirjoitetuista muistiinpanoista ja kaavioista valokuviin.
Käännä eri kielten välillä reaaliaikaisesti, harjoittele kielioppia ja luo monikielistä sisältöä.
Luo verkkosivuja HTML- ja CSS-muodossa, muuta kuvat jäsennellyksi JSON-dataksi ja debuggaa monimutkaisia koodipohjia.
Osallistu luonnollisiin keskusteluihin ja anna yksityiskohtaisia, helposti ymmärrettäviä vastauksia.
Valtavan konteksti-ikkunan ansiosta Claude voi sulattaa suurempia tietopaketteja, analysoida kokonaisen kirjan tai arvostella pitkän esseen yhdellä kertaa.

Tuetut asiakirjatyypit:

PDF
DOCX
CSV
TXT
HTML
ODT
RTF
EPUB
JSON

Tiedostorajat:

30MB per tiedosto
Enintään 5 tiedostoa per chat

Tekniset rajoitukset: Claude ei voi hakea tietoja Internetistä, luoda kuvia, ei äänitilaa.

Claude ymmärtää vitsejä, sanaleikkejä, anteeksipyyntöjä ja kohteliaisuuksia. Chatbotin poikkeuksellisten kirjoitustaitojen ansiosta se voi laatia tunteikkaita, ihmisen kaltaisia tarinoita.

Jotkut ihmiset kuitenkin valittavat, että chatbotista on tullut huonompi kirjoittamaan, ja syynä tähän on Clauden luonne.

Tekoälymalleja kehittävät yritykset kouluttavat niitä yleensä välttämään haitallisten asioiden sanomista ja avustamista haitallisissa tehtävissä. Tavoitteena on kouluttaa mallit käyttäytymään tavalla, joka on ”vaaraton”. Mutta kun ajattelemme aidosti ihailtavina pitämiemme ihmisten luonnetta, emme ajattele vain vahingon välttämistä. Ajattelemme niitä, jotka ovat uteliaita maailmaa kohtaan, jotka pyrkivät kertomaan totuuden olematta epäystävällisiä ja jotka kykenevät näkemään asian monta puolta tulematta kuitenkaan liian itsevarmoiksi tai liian varovaisiksi näkemyksissään. Ajattelemme niitä, jotka ovat kärsivällisiä kuuntelijoita, huolellisia ajattelijoita, nokkelia keskustelijoita ja monia muita ominaisuuksia, jotka yhdistämme viisaaseen ja monipuoliseen ihmiseen.

Toisinaan Claude käyttäytyy arkajalkaisesti ja kieltäytyy vastaamasta arkaluonteisiin kysymyksiin. Kehittäjät ovat hyvin ylpeitä siitä, että botista on vaikea saada irti laitonta tietoa, kuten miten väärentää rahaa tai miten piiloutua poliisilta. Joskus Claude kuitenkin kytkee itsesensuurin päälle ja luennoi vastauksena täysin harmittomiin pyyntöihin. Botti kieltäytyy esimerkiksi kirjoittamasta hauskaa tarinaa potkujen saamisesta, koska ”ei halua loukata kenenkään tunteita sopimattomalla huumorilla”; tai se voi vedota tekijänoikeusrikkomukseen, jos sitä pyydetään parodioimaan kuuluisaa hahmoa.

Reddit-käyttäjät pilkkaavat Claudea:

Minä: Hei; Claude: alkaa pyytää anteeksi.

Mutta tällä herkkyydellä on myös hyvä puoli - Anthropic suojelee yksityisyyttäsi:

Anthropic ei kouluta mallejaan tietojesi perusteella. Ne poistavat kaikki tietosi automaattisesti 30 päivän kuluttua, ja voit poistaa kokonaisia keskusteluja heidän palvelimiltaan milloin tahansa.

Miten Claudea käytetään

Claude voi tarkastella ja ymmärtää perusteellisesti pitkiä oikeudellisia asiakirjoja, kuten sopimuksia tai tapaustiedostoja. Ottamalla tämän aikaa vievän tehtävän haltuunsa Claude auttaa lakimiehiä säästämään arvokasta aikaansa korkeamman tason työhön. Siksi juridista teknologiaa kehittävä startup-yritys Robin AI käyttää Claudea juridisen paperityön analysointiin.

Scribd, Inc. käyttää Claudea tuottamaan korkealaatuista metatietoa miljoonille käyttäjien lataamille asiakirjoille, mikä parantaa sisällön löydettävyyttä ja edistää käyttäjien sitoutumista sen maailmanlaajuisilla alustoilla.

Auttoi käsittelemään 70 prosenttia käyttäjien lataamasta sisällöstä, josta puuttui laadukas metatieto.
Rikkaammat sisällönkuvaukset lisäsivät merkittävästi käyttäjien rekisteröitymistä ja tilauksia.
Skaalautui käsittelemään yli 100 miljoonaa asiakirjaa.

Newfront on nykyaikainen vakuutusalusta, joka käyttää Claudea automatisoidakseen ikävät vakuutustehtävät ja tarjotakseen välitöntä tukea, mikä tekee vakuutuksista helpommin lähestyttäviä ja tehokkaampia kaikille.

Clauden avulla Newfront:

Säästää henkilöstöhallinnon tiimeiltä yhden kuukauden vuodessa ja tarjoaa työntekijöille 24/7 henkilökohtaista tukea.
Vähentää asiakirjojen käsittelykustannuksia 60 prosenttia.
Tarjoaa välittömiä sopimustarkastuksia lakitiimeille.

Zapia auttaa latinalaisamerikkalaisia kuluttajia löytämään tuotteita, tekemään ostoksia ja saamaan tukea suosittujen viestisovellusten, kuten WhatsAppin, kautta.

Claudea käyttämällä Zapia:

Kasvoi 2,5 miljoonalla käyttäjällä ensimmäisen vuoden aikana.
Tuotti yli 90 prosenttia positiivista käyttäjäpalautetta.
Käsittelee satoja tuhansia viestejä tunnissa.

Kuten näet, Clauden monipuolisuus eri toimialoilla korostaa sen kaupallista potentiaalia. Yritykset käyttävät sitä työnkulkuihin myynnistä ohjelmistokehitykseen. Automatisoimalla toistuvia tehtäviä ja avustamalla sisällön luomisessa Claude voi lisätä tuottavuutta ja vapauttaa työntekijöitä keskittymään arvokkaampaan työhön.

Lisätietoja Clauden asiakkaista ja kaupallisista käyttötapauksista löydät täältä: https://www.anthropic.com/customers.

Tilastot perustuvat 1 miljoonaan satunnaisesti valittuun keskusteluun:

10,4% - Web- ja mobiilisovellusten kehittäminen
9,2% - Sisällön luominen ja viestintä
7,2% - Akateeminen tutkimus ja kirjoittaminen
7,1 % - Koulutus ja urakehitys
6,0 % - Kehittynyt tekoäly / koneoppimissovellukset
5,7 % - Liiketoimintastrategia ja toiminta
4,5 % - Kielten kääntäminen
3,9 % - DevOps ja pilvi-infrastruktuuri
3,7 % - Digitaalinen markkinointi ja SEO
3,5 % - Data-analyysi ja visualisointi

Tiedot kerättiin Cliolla (Claude Insights and Observations), alustalla, joka tarjoaa yleiskuvan tekoälyn käyttötavoista ja paljastaa trendejä ja käyttäytymistä vaarantamatta yksilön yksityisyyttä.

Sovellusten laaja kirjo ja huomattavat käyttömäärät eri kategorioissa korostavat, miten tekoälykäyttöiset ratkaisut ovat yleistymässä. Tämä suuntaus osoittaa Clauden kaltaisten työkalujen monipuolisuuden ja kuvastaa tekoälyn lisääntyvää integroitumista työ- ja yksityiselämäämme.