Claude: Поглед отблизо към иновативния ИИ на Anthropic

Chatbot Claude от Anthropic е един от основните конкуренти на ChatGPT. Компанията може и да не е толкова известна, колкото OpenAI, но е успешна и добре финансирана. През последните няколко години Amazon инвестира 4 млрд. долара в Anthropic, а през ноември 2024 г. обяви нова инвестиция от още 4 млрд. долара, с което общата сума достигна 8 млрд. долара. Що се отнася до Клод, хората хвалят чатбота за неговата човечност, креативност, чувствителност и емоционална интелигентност. В тази статия ще разгледаме историята на чатбота Клод, неговите основни принципи, предимства и ограничения.

Произход на Claude

Компанията Anthropic е съоснована от Дарио Амодей и сестра му Даниела Амодей. Преди да основат компанията си, и двамата работят в OpenAI: Дарио е вицепрезидент по изследванията и ръководи създаването на влиятелни модели като GPT-2 и GPT-3, а Даниела е вицепрезидент по безопасността и политиката.

Дарио и Даниела Амодей

Защо Дарио Амодей напусна OpenAI? Някои източници твърдят, че той е напуснал поради опасения, че OpenAI все повече дава приоритет на всичко друго, но не и на етичното развитие на изкуствения интелект. А ето какво казва самият Дарио:

„Съществува много дезинформация. Хората казват, че сме напуснали, защото не сме харесали сделката с Microsoft. Това е лъжа.“ Истинската причина за напускането, казва той, е, че „е изключително непродуктивно да се опитваш да спориш с визията на някой друг“. Затова, вместо да остане в OpenAI, Амодей си казва: „Вземи няколко души, на които имаш доверие, и отиди да осъществиш своята визия.“

Така Дарио, Даниела и още няколко бивши служители на OpenAI създават Anthropic през 2021 г., за да реализират своята визия за изкуствен интелект. През март 2023 г. те пускат първата версия на езиковия модел на Claude. Името е вдъхновено най-вече от Клод Шанън, американски математик, учен и изобретател, известен като „баща на теорията на информацията“ и „баща на информационната ера“.

Клод Шанън

Принципи и ценности на Claude

Мисията на компанията е да изследва безопасността, вътрешното функциониране и общественото въздействие на моделите на изкуствен интелект, като гарантира, че изкуственият интелект има положително въздействие върху обществото, тъй като става все по-усъвършенстван и способен.

Дарио Амодей:

От самото начало се опитваме да проектираме Claude с оглед на безопасността и възможността за управление. Много от първите ни клиенти бяха предприятия, които много държат на това моделът да не прави нещо непредвидимо. Или да си измисля факти. Една от големите идеи зад Claude е нещо, наречено конституционен AI. Конституционният изкуствен интелект се основава на обучението на модела да следва ясен набор от принципи. Така че можете да бъдете по-прозрачни относно това, което прави моделът. А това улеснява контрола върху модела и го прави безопасен.

Какво представлява конституционният изкуствен интелект? Това е метод за обучение на полезен, честен и безвреден асистент с изкуствен интелект чрез самоусъвършенстване без човешки етикети, които да идентифицират вредни резултати.

Този процес включва две фази - фаза на обучение с наблюдение и фаза на обучение с подсилване:

Във фазата на контролирано обучение се прави извадка от първоначален модел, генерират се самокритики и корекции, а първоначалният модел се настройва на базата на ревизираните отговори.
Във фазата на обучение с подсилване се оценяват извадките от прецизно настроения модел и се обучава модел на предпочитанията от набор от данни за предпочитанията на ИИ. След това моделът на предпочитанията се използва като сигнал за възнаграждение за обучение на асистента на ИИ.

Както може да се види на графиката, този подход дава по-добри резултати в сравнение с конвенционалния метод на обучение с усилване от човешка обратна връзка (RLFH), използван за обучение на други езикови модели. Това означава, че Claude е по-малко вероятно да казва вредни неща и се държи по-рядко лошо от други чатботове.

Конституционен RL срещу стандартен RLHF

Единственият човешки надзор се осигурява чрез списък с правила или принципи, взети от различни източници, като Декларацията на ООН за правата на човека или принципите на Sparrow от DeepMind. Можете да научите повече за това тук: https://www.anthropic.com/news/claudes-constitution

Характеристики на Claude и актуални модели

Обикновено системите за изкуствен интелект се оценяват въз основа на това как се представят на сравнителни оценки - стандартизирани тестове, които се дават на моделите, за да се определи доколко са способни да кодират, да отговарят на математически въпроси или други задачи. По тези показатели последните версии на Claude са приблизително сравними с най-мощните модели на OpenAI и Google.

Claude 3.5 спрямо други модели в бенчмаркове

Но ключовата характеристика на Claude - неговата емоционална интелигентност - не е нещо, което може лесно да се измери. Хората казват, че Claude просто се чувства различен. По-креативен и съпричастен. По-проницателен и не толкова дразнещо роботизиран. Те казват, че отговорите на Claude приличат на отговорите, които би дал интелигентен и внимателен човек, и по-малко на общата проза, генерирана от други чатботове.

Разработчиците подчертават следните положителни аспекти на чатбота:

Claude е сигурен, тъй като предлага достъпност чрез AWS и GCP, сертификация SOC 2 Type II и опции за съответствие с HIPAA, като се придържа към строги практики за сигурност.
Claude е благонадежден, защото съчетава най-добрата в класа си устойчивост на бягство от затвора и предотвратяване на злоупотреби.
Claude е надежден, тъй като може да се похвали с много нисък процент на халюцинации и много висока точност, дори когато работи с дълги документи.

Сравнение на настоящите модели на Claude:

Модел	Claude 3.5 Sonnet	Claude 3.5 Haiku	Claude 3 Opus	Claude 3 Sonnet	Claude 3 Haiku
Описание	Най-интелигентният модел	Най-бърз модел	Мощен модел за много сложни задачи	Баланс между интелигентност и бързина	Най-бързият и компактен модел за почти незабавна реакция
Силни страни	Най-високо ниво на интелигентност и способност	Интелигентност със светкавична скорост	Интелигентност, гладкост и разбиране на най-високо ниво	Силна полезност, балансирана за мащабирани разгръщания	Бързо и точно насочено изпълнение
Многоезичен	Да	Да	Да	Да	Да
Визия	Да	Не	Да	Да	Да
Сравнителна латентност	Бърз	Най-бързият	Умерено бързо	Бърз	Най-бързият
Контекстен прозорец	200 хил. токена	200 хил. токена	200 хил. токена	200 хил. токена	200 хил. токена
Максимална мощност	8192 токена	8192 токена	4096 токена	4096 токена	4096 токена
Прекъсване на данните за обучение	Април 2024 г.	Юли 2024 г.	Август 2023 г.	Август 2023 г.	Август 2023 г.

200 хил. лексеми отговарят приблизително на 150 хил. английски думи или 680 хил. символа Unicode.

8192 токена отговарят приблизително на 6200 английски думи или 12-14 страници с единичен интервал.

4096 токена отговарят приблизително на 3100 английски думи или 6-7 страници с единичен интервал.

Два от най-новите модели се наричат Claude 3.5 Sonnet и Claude 3.5 Haiku.

Claude 3.5 Sonnet е най-мощният и интелигентен модел. Той може да разбира нюансирани инструкции и контекст, да разпознава и поправя собствените си грешки, да извлича информация от визуализации като таблици, графики и сложни диаграми. Подобрените възможности за разсъждение, големият контекстен прозорец, ниският процент на халюцинации и топлият, подобен на човешки тон на всичкото отгоре правят Claude 3.5 Sonnet идеален чатбот за отговаряне на въпроси, анализиране на документи и бази от знания.

Claude 3.5 Haiku е най-бързият модел. Той наистина блести навсякъде, където се нуждаете от бързо време за реакция, независимо дали става въпрос за обслужване на клиенти, социални платформи, онлайн общности, електронна търговия или образование. Claude 3.5 Haiku предоставя бързи и точни предложения за код, за да ускори разработването. Той е идеален за софтуерни екипи, които искат да опростят кодирането и да увеличат производителността. Claude 3.5 Haiku поддържа само текстово въвеждане, което означава, че не може да обработва визуални данни.

Какво може да направи Claude: неговите силни и слаби страни

Подходяща за всяка задача, фамилията модели Claude предлага най-добрата комбинация от скорост и производителност. Claude може да изпълнява сложни когнитивни задачи и рутинна обработка на данни с еднаква лекота. От сложно разбиране на езика до бързо пресмятане на числа - моделите Claude са вашите асистенти за широк спектър от професионални и лични нужди:

Преписвайте и анализирайте статични изображения - от ръкописни бележки и графики до снимки.
Превеждайте между различни езици в реално време, упражнявайте граматиката и създавайте многоезично съдържание.
Създавайте уебсайтове в HTML и CSS, превръщайте изображенията в структурирани данни JSON и отстранявайте грешки в сложни бази от кодове.
Участвайте в естествени разговори и предоставяйте подробни и лесно разбираеми отговори.
Благодарение на огромния си контекстен прозорец Клод може да усвоява по-големи количества данни, като анализира цяла книга или критикува дълго есе с един замах.

Поддържани типове документи:

PDF
DOCX
CSV
TXT
HTML
ODT
RTF
EPUB
JSON

Ограничения на файловете:

30 MB на файл
До 5 файла на чат

Технически ограничения: Claude не може да търси информация в интернет, да генерира изображения, няма гласов режим.

Клод разбира шеги, каламбури, извинения и комплименти. Изключителните умения за писане на чатбота му позволяват да създава емоционални истории, подобни на човешките.

Някои хора обаче се оплакват, че чатботът е станал по-лош в писането, а причината за това е характерът на Claude.

Компаниите, които разработват модели на изкуствен интелект, обикновено ги обучават да избягват да казват вредни неща и да не помагат при изпълнението на вредни задачи. Целта на това е да се обучат моделите да се държат по начин, който е „безвреден“. Но когато мислим за характера на тези, които намираме за истински възхитителни, не мислим само за избягване на вредите. Мислим за тези, които са любопитни за света, които се стремят да казват истината, без да са недоброжелателни, и които са способни да видят много страни на даден проблем, без да стават прекалено самоуверени или прекалено предпазливи във възгледите си. Мислим за тези, които са търпеливи слушатели, внимателни мислители, остроумни събеседници и много други черти, които свързваме с мъдрия и всестранно развит човек.

Понякога Claude се държи плахо, отказвайки да отговаря на всякакви деликатни въпроси. Разработчиците много се гордеят с факта, че е трудно да се извлече незаконна информация от бота, например как да се фалшифицират пари или как да се скрие от полицията. Но понякога Claude включва автоцензура и изнася лекции в отговор на напълно безобидни запитвания. Например ботът отказва да напише забавна история за уволнение, защото „не иска да нарани чувствата на никого с неподходящ хумор“; или може да се позове на нарушаване на авторските права, ако бъде помолен да пародира известен герой.

Потребителите на Reddit се подиграват на Claude:

Аз: Здравей; Claude: започва да се извинява

Но тази чувствителност има и добра страна - Anthropic много добре защитава личните ви данни:

Политики за поверителност: ChatGPT срещу Claude

Anthropic не тренира моделите си върху вашите данни. Те автоматично изтриват цялата ви информация след 30 дни и можете да премахнете цели чатове от сървърите им по всяко време.

Как хората използват Claude

Claude може да преглежда и разбира задълбочено дълги правни документи, като например договори или досиета на дела. И като поема тази трудоемка задача, Claude помага на адвокатите да спестят ценното си време за работа на по-високо ниво. Ето защо стартъпът за правни технологии Robin AI използва Claude за анализ на правни документи.

Scribd, Inc. използва Claude, за да генерира висококачествени метаданни за милиони документи, качени от потребителите, като подобрява откриваемостта на съдържанието и стимулира ангажираността на потребителите в своите глобални платформи.

Помогна за справяне със 70% от съдържанието, качено от потребителите, което нямаше качествени метаданни.
По-богатите описания на съдържанието значително увеличиха регистрациите и абонаментите на потребителите.
Мащабирано за обработка на над 100 милиона документа.

Newfront, модерна застрахователна платформа, използва Claude, за да автоматизира досадните застрахователни задачи и да осигурява незабавна поддръжка, като прави застраховането по-достъпно и ефективно за всички.

С Claude Newfront:

спестява на екипите по човешки ресурси един месец годишно и осигурява 24/7 персонализирана поддръжка за служителите.
Намалява разходите за обработка на документи с 60%.
Осигурява незабавни прегледи на договорите за правните екипи.

Zapia помага на латиноамериканските потребители да откриват продукти, да правят покупки и да получават подкрепа чрез популярни приложения за съобщения като WhatsApp.

С помощта на Claude Zapia:

Нарасна с 2,5 милиона потребители през първата си година.
Генерира над 90% положителна обратна връзка от потребителите.
Обработва стотици хиляди съобщения на час.

Както можете да видите, универсалността на Claude в различни индустрии подчертава търговския му потенциал. Компаниите го внедряват за работни потоци от продажби до разработване на софтуер. Като автоматизира повтарящи се задачи и подпомага създаването на съдържание, Claude може да повиши производителността и да освободи човешки работници, които да се съсредоточат върху работа с по-висока стойност.

Научете повече за клиентите на Claude и случаите на търговска употреба тук: https://www.anthropic.com/customers

Статистиката се основава на 1 милион произволно избрани чата:

10,4% - Разработване на уеб и мобилни приложения
9,2% - Създаване на съдържание и комуникация
7,2% - Академични изследвания и писане
7,1% - Образование и кариерно развитие
6,0% - Приложения за усъвършенстване на изкуствен интелект/машинно обучение
5,7% - Бизнес стратегия и операции
4,5% - Езиков превод
3,9% - DevOps и облачна инфраструктура
3,7% - Цифров маркетинг и SEO
3,5% - Анализ и визуализация на данни

Данните са събрани от Clio (Claude Insights and Observations) - платформа, която осигурява преглед на моделите на използване на ИИ, разкривайки тенденции и поведение, без да се нарушава неприкосновеността на личния живот.

Голямото разнообразие от приложения и значителните проценти на използване в различните категории подчертават как решенията, задвижвани от ИИ, стават все по-разпространени. Тази тенденция демонстрира гъвкавостта на инструменти като Claude и отразява нарастващата интеграция на ИИ в нашия професионален и личен живот.