Claude: Bliższe spojrzenie na innowacyjną sztuczną inteligencję Anthropic

Chatbot Claude firmy Anthropic jest jednym z głównych konkurentów ChatGPT. Firma może nie jest tak znana jak OpenAI, ale odnosi sukcesy i jest dobrze finansowana. W ciągu ostatnich kilku lat Amazon zainwestował 4 miliardy dolarów w Anthropic, a w listopadzie 2024 roku ogłosił nową inwestycję w wysokości kolejnych 4 miliardów dolarów, co daje łącznie 8 miliardów dolarów. Jeśli chodzi o Claude'a, ludzie chwalą chatbota za jego człowieczeństwo, kreatywność, wrażliwość i inteligencję emocjonalną. W tym artykule przyjrzymy się historii chatbota Claude, jego podstawowym zasadom, zaletom i ograniczeniom.

Początki Claude'a

Anthropic jest współzałożony przez Dario Amodei i jego siostrę Danielę Amodei. Przed założeniem firmy oboje pracowali w OpenAI: Dario był wiceprezesem ds. badań i kierował tworzeniem wpływowych modeli, takich jak GPT-2 i GPT-3, podczas gdy Daniela była wiceprezesem ds. bezpieczeństwa i polityki.

Dario i Daniela Amodei

Dlaczego Dario Amodei opuścił OpenAI? Niektóre źródła podają, że odszedł z powodu obaw, że OpenAI coraz bardziej priorytetowo traktuje wszystko poza etycznym rozwojem sztucznej inteligencji. A oto, co mówi sam Dario:

„Istnieje wiele błędnych informacji. Ludzie mówią, że odeszliśmy, bo nie podobała nam się umowa z Microsoftem. Fałsz.” Prawdziwym powodem odejścia, jak powiedział, jest to, że „próba spierania się z czyjąś wizją jest niezwykle nieproduktywna”. Zamiast pozostać w OpenAI, Amodei powiedział sobie: „Weź kilku zaufanych ludzi i zrealizuj swoją wizję”.

Tak więc Dario, Daniela i kilku innych byłych pracowników OpenAI utworzyło Anthropic w 2021 roku, aby zrealizować swoją wizję sztucznej inteligencji. W marcu 2023 roku wydali pierwszą wersję modelu językowego Claude. Nazwa została zainspirowana Claude'em Shannonem, amerykańskim matematykiem, naukowcem i wynalazcą znanym jako „ojciec teorii informacji” i „ojciec ery informacji”.

Claude Shannon

Zasady i wartości Claude

Misją firmy jest badanie bezpieczeństwa, wewnętrznego działania i wpływu społecznego modeli sztucznej inteligencji, zapewniając, że sztuczna inteligencja ma pozytywny wpływ na społeczeństwo, ponieważ staje się coraz bardziej zaawansowana i zdolna.

Dario Amodei:

Od samego początku staraliśmy się projektować Claude z myślą o bezpieczeństwie i kontroli. Wielu naszych pierwszych klientów to przedsiębiorstwa, które bardzo dbają o to, by model nie robił niczego nieprzewidywalnego. Lub wymyślać fakty. Jedną z głównych idei stojących za Claude jest coś, co nazywa się konstytucyjną sztuczną inteligencją. Konstytucyjna sztuczna inteligencja opiera się na szkoleniu modelu w celu przestrzegania wyraźnego zestawu zasad. Dzięki temu możesz być bardziej przejrzysty w kwestii tego, co robi model. Ułatwia to kontrolowanie modelu i uczynienie go bezpiecznym.

Czym jest konstytucyjna sztuczna inteligencja? Jest to metoda szkolenia pomocnego, uczciwego i nieszkodliwego asystenta AI poprzez samodoskonalenie bez żadnych ludzkich etykiet identyfikujących szkodliwe wyniki.

Proces ten obejmuje dwie fazy: fazę uczenia nadzorowanego i fazę uczenia ze wzmocnieniem:

W fazie nadzorowanej próbkowany jest początkowy model, generowane są samokrytyki i poprawki, a oryginalny model jest dostrajany na podstawie poprawionych odpowiedzi.
W fazie uczenia ze wzmocnieniem próbki z dostrojonego modelu są oceniane, a model preferencji jest trenowany na podstawie zbioru danych preferencji SI. Model preferencji jest następnie wykorzystywany jako sygnał nagrody do szkolenia asystenta SI.

Jak widać na wykresie, podejście to daje lepsze wyniki w porównaniu z konwencjonalną metodą uczenia ze wzmocnieniem na podstawie ludzkich opinii (RLFH), stosowaną do trenowania innych modeli językowych. Oznacza to, że Claude rzadziej mówi szkodliwe rzeczy i rzadziej zachowuje się niewłaściwie niż inne chatboty.

Konstytucyjny RL vs Standardowy RLHF

Jedyny ludzki nadzór zapewnia lista reguł lub zasad zapożyczonych z różnych źródeł, takich jak Deklaracja Praw Człowieka ONZ lub Sparrow Principles od DeepMind. Więcej informacji na ten temat można znaleźć tutaj: https://www.anthropic.com/news/claudes-constitution

Funkcje Claude'a i obecne modele

Zazwyczaj systemy sztucznej inteligencji są oceniane na podstawie ich wyników w testach porównawczych - standardowych testach przeprowadzanych na modelach w celu określenia ich zdolności do kodowania, odpowiadania na pytania matematyczne lub innych zadań. Według tych wskaźników najnowsze wersje Claude są z grubsza porównywalne z najpotężniejszymi modelami OpenAI i Google.

Claude 3.5 vs inne modele w testach porównawczych

Ale zabójcza cecha Claude'a - jego inteligencja emocjonalna - nie jest czymś, co można łatwo zmierzyć. Ludzie mówią, że Claude jest po prostu inny. Bardziej kreatywny i empatyczny. Bardziej wnikliwy i mniej robotyczny. Mówią, że wyniki Claude są podobne do odpowiedzi, których udzieliłby inteligentny, uważny człowiek, a mniej do ogólnej prozy generowanej przez inne chatboty.

Deweloperzy podkreślają następujące pozytywne aspekty chatbota:

Claude jest bezpieczny, ponieważ oferuje dostępność za pośrednictwem AWS i GCP, certyfikację SOC 2 typu II i opcje zgodności z HIPAA, przestrzegając rygorystycznych praktyk bezpieczeństwa.
Claude jest godny zaufania, ponieważ łączy w sobie najlepszą w swojej klasie odporność na jailbreak i zapobieganie nadużyciom.
Claude jest niezawodny, ponieważ może pochwalić się bardzo niskim wskaźnikiem halucynacji i bardzo wysoką dokładnością, nawet podczas pracy z długimi dokumentami.

Porównanie obecnych modeli Claude:

Model	Claude 3.5 Sonnet	Claude 3.5 Haiku	Claude 3 Opus	Claude 3 Sonnet	Claude 3 Haiku
Opis	Najbardziej inteligentny model	Najszybszy model	Wydajny model do bardzo złożonych zadań	Równowaga inteligencji i szybkości	Najszybszy i najbardziej kompaktowy model zapewniający niemal natychmiastową reakcję
Mocne strony	Najwyższy poziom inteligencji i zdolności	Inteligencja z niesamowitą prędkością	Najwyższy poziom inteligencji, płynności i zrozumienia	Silna użyteczność, zrównoważona dla skalowanych wdrożeń	Szybkie i dokładne ukierunkowane działanie
Wielojęzyczny	Tak	Tak	Tak	Tak	Tak
Wizja	Tak	Nie	Tak	Tak	Tak
Opóźnienie porównawcze	Szybko	Najszybszy	Umiarkowanie szybki	Szybko	Najszybszy
Okno kontekstowe	200 tys. tokenów	200 tys. tokenów	200 tys. tokenów	200 tys. tokenów	200 tys. tokenów
Maksymalna moc wyjściowa	8192 tokenów	8192 tokenów	4096 tokenów	4096 tokenów	4096 tokenów
Odcięcie danych treningowych	Kwiecień 2024 r.	Lipiec 2024 r.	Sierpień 2023 r.	Sierpień 2023 r.	Sierpień 2023 r.

200 tys. tokenów odpowiada w przybliżeniu 150 tys. angielskich słów lub 680 tys. znaków Unicode.

8192 tokeny odpowiadają w przybliżeniu 6200 angielskim słowom lub 12-14 stronom z pojedynczymi odstępami.

4096 tokenów odpowiada w przybliżeniu 3100 angielskim słowom lub 6-7 stronom z pojedynczymi odstępami.

Dwa najnowsze modele noszą nazwy Claude 3.5 Sonnet i Claude 3.5 Haiku.

Claude 3.5 Sonnet to najpotężniejszy i najbardziej inteligentny model. Potrafi zrozumieć szczegółowe instrukcje i kontekst, rozpoznać i poprawić własne błędy, wydobyć informacje z wizualizacji, takich jak wykresy, grafy i złożone diagramy. Rozszerzone możliwości rozumowania, duże okno kontekstowe, niski wskaźnik halucynacji i ciepły, ludzki ton sprawiają, że Claude 3.5 Sonnet jest idealnym chatbotem do odpowiadania na pytania, analizowania dokumentów i baz wiedzy.

Claude 3.5 Haiku to najszybszy model. Sprawdza się wszędzie tam, gdzie potrzebny jest szybki czas reakcji, czy to w obsłudze klienta, platformach społecznościowych, społecznościach internetowych, handlu elektronicznym czy edukacji. Claude 3.5 Haiku zapewnia szybkie i dokładne sugestie dotyczące kodu, aby przyspieszyć rozwój. Jest to idealne rozwiązanie dla zespołów programistycznych, które chcą uprościć kodowanie i zwiększyć produktywność. Claude 3.5 Haiku obsługuje tylko wprowadzanie tekstu, co oznacza, że nie może przetwarzać danych wizualnych.

Co potrafi Claude: jego mocne i słabe strony

Odpowiednio dobrana do każdego zadania, rodzina modeli Claude oferuje najlepsze połączenie szybkości i wydajności. Claude może wykonywać złożone zadania poznawcze i rutynowe przetwarzanie danych z równą łatwością. Od zaawansowanego rozumienia języka po szybkie obliczanie liczb, modele Claude to asystenci, którzy zaspokoją szeroki zakres potrzeb zawodowych i osobistych:

Transkrypcja i analiza statycznych obrazów, od odręcznych notatek i wykresów po zdjęcia.
Tłumaczenie między różnymi językami w czasie rzeczywistym, ćwiczenie gramatyki i tworzenie wielojęzycznych treści.
Tworzyć strony internetowe w HTML i CSS, przekształcać obrazy w ustrukturyzowane dane JSON i debugować złożone bazy kodu.
Angażować się w naturalne rozmowy i udzielać szczegółowych, zrozumiałych odpowiedzi.
Ze względu na ogromne okno kontekstowe, Claude może przetrawić większe fragmenty danych, analizując całą książkę lub krytykując długi esej za jednym razem.

Obsługiwane typy dokumentów:

PDF
DOCX
CSV
TXT
HTML
ODT
RTF
EPUB
JSON

Limity plików:

30 MB na plik
Do 5 plików na czat

Ograniczenia techniczne: Claude nie może wyszukiwać informacji w Internecie, generować obrazów, brak trybu głosowego.

Claude rozumie żarty, kalambury, przeprosiny i komplementy. Wyjątkowe umiejętności pisarskie chatbota pozwalają mu tworzyć emocjonalne, podobne do ludzkich historie.

Jednak niektórzy narzekają, że chatbot stał się gorszy w pisaniu, a powodem tego jest charakter Claude'a.

Firmy opracowujące modele sztucznej inteligencji zazwyczaj szkolą je, aby unikały mówienia szkodliwych rzeczy i pomagania w szkodliwych zadaniach. Celem tego jest wyszkolenie modeli tak, by zachowywały się w sposób „nieszkodliwy”. Ale kiedy myślimy o charakterze tych, których uważamy za naprawdę godnych podziwu, nie myślimy tylko o unikaniu szkód. Myślimy o tych, którzy są ciekawi świata, którzy starają się mówić prawdę bez bycia niemiłymi i którzy są w stanie dostrzec wiele stron danej kwestii, nie stając się zbyt pewnymi siebie lub zbyt ostrożnymi w swoich poglądach. Myślimy o tych, którzy są cierpliwymi słuchaczami, uważnymi myślicielami, dowcipnymi rozmówcami i wieloma innymi cechami, które kojarzymy z byciem mądrą i wszechstronną osobą.

Czasami Claude zachowuje się nieśmiało, odmawiając odpowiedzi na delikatne pytania. Deweloperzy są bardzo dumni z faktu, że trudno jest wydobyć od bota nielegalne informacje, takie jak sposoby fałszowania pieniędzy lub ukrywania się przed policją. Czasami jednak Claude włącza autocenzurę i wykłada się w odpowiedzi na zupełnie nieszkodliwe prośby. Na przykład, bot odmawia napisania zabawnej historii o zwolnieniu z pracy, ponieważ „nie chce zranić niczyich uczuć nieodpowiednim humorem”; lub może powołać się na naruszenie praw autorskich, jeśli zostanie poproszony o sparodiowanie znanej postaci.

Użytkownicy Reddita naśmiewają się z Claude'a:

Ja: Cześć; Claude: zaczyna przepraszać

Jest jednak dobra strona tej wrażliwości - Anthropic bardzo chroni prywatność użytkowników:

Anthropic nie trenuje swoich modeli na danych użytkownika. Automatycznie usuwa wszystkie informacje po 30 dniach, a użytkownik może usunąć całe czaty z ich serwerów w dowolnym momencie.

Jak ludzie używają Claude

Claude może dokładnie przejrzeć i zrozumieć długie dokumenty prawne, takie jak umowy lub akta spraw. Podejmując się tego czasochłonnego zadania, Claude pomaga prawnikom zaoszczędzić cenny czas na pracę na wyższym poziomie. Właśnie dlatego startup prawniczy Robin AI wykorzystuje Claude do analizy dokumentów prawnych.

Firma Scribd, Inc. wykorzystuje Claude do generowania wysokiej jakości metadanych dla milionów dokumentów przesyłanych przez użytkowników, poprawiając możliwości odkrywania treści i zwiększając zaangażowanie użytkowników na swoich globalnych platformach.

Pomogła rozwiązać problem 70% treści pobieranych przez użytkowników, którym brakowało wysokiej jakości metadanych.
Bogatsze opisy treści znacznie zwiększyły liczbę rejestracji i subskrypcji użytkowników.
Skalowanie do przetwarzania ponad 100 milionów dokumentów.

Newfront, nowoczesna platforma ubezpieczeniowa, wykorzystuje Claude do automatyzacji żmudnych zadań ubezpieczeniowych i zapewnienia natychmiastowego wsparcia, dzięki czemu ubezpieczenia są bardziej dostępne i wydajne dla wszystkich.

Dzięki Claude, Newfront:

Oszczędza zespołom HR jeden miesiąc rocznie i zapewnia spersonalizowane wsparcie 24/7 dla pracowników.
Zmniejsza koszty przetwarzania dokumentów o 60%.
Zapewnia natychmiastowe przeglądy umów dla zespołów prawnych.

Zapia pomaga konsumentom z Ameryki Łacińskiej odkrywać produkty, dokonywać zakupów i uzyskiwać wsparcie za pośrednictwem popularnych aplikacji do przesyłania wiadomości, takich jak WhatsApp.

Dzięki wykorzystaniu Claude, Zapia

Wzrosła o 2,5 miliona użytkowników w ciągu pierwszego roku.
Wygenerowała ponad 90% pozytywnych opinii użytkowników.
Obsługuje setki tysięcy wiadomości na godzinę.

Jak widać, wszechstronność Claude w różnych branżach podkreśla jego potencjał komercyjny. Firmy wdrażają go w przepływach pracy od sprzedaży po rozwój oprogramowania. Automatyzując powtarzalne zadania i pomagając w tworzeniu treści, Claude może zwiększyć produktywność i uwolnić pracowników, aby mogli skupić się na pracy o wyższej wartości.

Więcej informacji o klientach i komercyjnych zastosowaniach Claude można znaleźć tutaj: https://www.anthropic.com/customers

Statystyki oparte na 1 milionie losowo wybranych czatów:

10,4% - Tworzenie stron internetowych i aplikacji mobilnych
9,2% - Tworzenie treści i komunikacja
7,2% - Badania naukowe i pisanie
7,1% - Edukacja i rozwój kariery
6,0% - Zaawansowane aplikacje sztucznej inteligencji / uczenia maszynowego
5,7% - Strategia i operacje biznesowe
4,5% - Tłumaczenia językowe
3,9% - DevOps i infrastruktura chmurowa
3,7% - Marketing cyfrowy i SEO
3,5% - Analiza i wizualizacja danych

Dane zostały zebrane przez Clio (Claude Insights and Observations), platformę, która zapewnia przegląd wzorców użytkowania sztucznej inteligencji, ujawniając trendy i zachowania bez naruszania prywatności poszczególnych osób.

Szeroka gama zastosowań i znaczne wskaźniki wykorzystania w różnych kategoriach podkreślają, że rozwiązania oparte na sztucznej inteligencji stają się coraz bardziej powszechne. Trend ten pokazuje wszechstronność narzędzi takich jak Claude i odzwierciedla rosnącą integrację sztucznej inteligencji z naszym życiem zawodowym i osobistym.